首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何获取维基百科页面的所有链接及其维基数据ID?

如何获取维基百科页面的所有链接及其维基数据ID?
EN

Stack Overflow用户
提问于 2016-05-07 21:30:33
回答 1查看 2.8K关注 0票数 5

(什么时候)可能出现以下情况?

  • 在一个查询/API调用中获取Wikipedia页面上所有链接的列表及其各自的Wikidata。
  • 在查询中接收与属性值类似的各个维基数据项的其他信息。
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-08 10:28:19

要获得所有维基百科页面链接,您必须使用维基百科API,并获得所有需要Wikidata的维基数据项属性,因此不可能通过对两个API的两个请求创建一个查询。但!你问题的第一部分已经成为可能。还有第二个..。你什么都没说你需要从维基数据那里得到什么信息。

你可以得到所有维基百科网页链接的维基数据ID和许多其他信息,如坐标,参考,内部和外部链接,图像,文本内容,投稿人,历史,页面权限,类别,模板等。要做到这一点,我们只能使用维基百科API,因为我们的入口点是维基百科页面,加上生成器特性。

例如,这是如何在海豚维基百科页面上获取维基数据ID、简短的介绍文本和前20个interwiki链接的主图像:

代码语言:javascript
运行
复制
https://en.wikipedia.org/w/api.php?action=query&generator=links&format=xml&redirects=1&titles=Dolphin&prop=pageprops|extracts|pageimages&gpllimit=20&ppprop=wikibase_item&exintro=1&exlimit=20&piprop=name&pilimit=20

查询 参数:

  • action=query&format=xml&redirects=1&titles=Dolphin
  • generator=links -获取所有页面链接 (与gpllimit=20一起工作)
  • prop=pageprops|extracts|pageimages -从链接中得到什么

属性:

  • 网页道具 -获取维基数据ID (与ppprop=wikibase_item一起工作)
  • 抽提物 -从该页面获取第一行文本(适用于exintro=1exlimit=20)
  • 分页图像 -获取主图像(与piprop=namepilimit=20一起工作)

同样,您可以获得参数这里中列出的另一个信息prop

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37093911

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档