要从一些文章中获取完整的维基百科修订历史列表,你需要使用维基百科提供的API来获取特定页面的修订历史。以下是获取维基百科修订历史的基本步骤和相关概念:
revisions
动作来构造请求URL。以下是一个使用Python获取维基百科页面修订历史的示例代码:
import requests
def get_wikipedia_revision_history(page_title):
base_url = "https://en.wikipedia.org/w/api.php"
params = {
"action": "query",
"format": "json",
"prop": "revisions",
"titles": page_title,
"rvprop": "timestamp|user",
"rvlimit": 500, # 最大允许的修订数量
"rvdir": "newer" # 获取最新的修订
}
response = requests.get(base_url, params=params)
data = response.json()
revisions = []
for page_id, page_info in data["query"]["pages"].items():
if "revisions" in page_info:
for rev in page_info["revisions"]:
revisions.append({
"timestamp": rev["timestamp"],
"user": rev["user"]
})
return revisions
# 示例使用
page_title = "Python (programming language)"
revision_history = get_wikipedia_revision_history(page_title)
for rev in revision_history:
print(f"Timestamp: {rev['timestamp']}, User: {rev['user']}")
rvcontinue
参数进行分页请求。通过以上步骤和代码示例,你可以获取并处理维基百科页面的修订历史。
领取专属 10元无门槛券
手把手带您无忧上云