我有一个大的json文件(更确切地说,是维基数据转储),压缩为gzip。我想要实现的是建立一个索引,这样我就可以随机访问并检索我想要的行/实体。找到感兴趣的线条(实体)的蛮力方式是:
from gzip import GzipFile
with GzipFile("path-to-wikidata/latest-all.json.gz", "r") as dump:
for line in dump:
# ....
据我所知,另一种选择是使用hdf5,通过转储进行一次传递,并在hdf5文件中存储所有感兴趣的内容。然而,方法的问题是,即
下面的Wikidata查询不像我所期望的那样工作:
# WikiData SPARQL Query
#
# Wolfgang Fahl 2018-01-06
#
# get father of queen victoria
SELECT ?queenVictoria ?queenVictoriaLabel ?fatherProperty ?fatherPropertyLabel ?father ?fatherLabel
WHERE {
#
# father
# https://www.wikidata.org/wiki/Property:P42
# Queen Victoria
# htt
我想知道在联邦查询中是否可以使用Wikidata服务。例如,以下查询
# Query from a local SPARQL enpoint
select ?item ?itemLabel
where {
SERVICE <https://query.wikidata.org/sparql> {
?item wdt:P31 wd:Q146.
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
}
返
我试图在我的java程序中访问,但是我得到了一条奇怪的消息,而不是我所期望的页面内容。
我怎么才能避免这种情况?
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html>
<head>
<title>303 See Other</title>
</head>
<body>
<h1>See Other</h1>
<p>The answer to your request is l
下面的查询是针对我的问题的 。当在维基数据查询服务上使用时,它将显示澳大利亚、->、澳大利亚和奥地利->等国家的shortNames请求。在基于Apache的 上运行相同的查询,shortName列保持为空(参见下面的屏幕快照)。
差异的原因是什么,以及如何修改查询以使其也与Apache一起工作?
# get a list countries with the corresponding ISO code
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX wd: &l