我已经从这个链接http://download.freebaseapps.com/下载了完整的RDF转储文件‘Freebase rdf-2012-12-09-00-00.gz’(7.5 00
此数据转储使用此处定义的Turtle RDF语法http://wiki.freebase.com/wiki/Data_dumps
如何将此文件加载到Virtuoso (06.04.3132)?
我试着使用这个命令
SQL> DB.DBA.TTLP_MT (file_to_string_output ('freebase-rdf-2012-12-09-00-00.gz'), '', 'http://freebase.com');
但它在很短的时间内完成了。以下请求仅从源文件中返回2行(三元组),并且日志中没有异常。
SELECT ?a ?b ?c from <http://freebase.com> where {?a ?b ?c}
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.name Number
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.type http://rdf.freebase.com/ns/type.property.
2 Rows. -- 78 msec.
顺便问一下,加载这么大的文件(8 GB RAM或24 GB RAM)可能需要多长时间?
这个转储文件可以不加修改地加载到TDB (通过tdbloader)、Sesame OpenRDF(通过加载)或OWLIM存储库中吗?
在合理的时间内加载后,我的SELECT SPARQL查询(不是很复杂)会得到响应吗?
谢谢!
发布于 2013-01-31 21:10:21
我已经收到来自freebase-讨论邮件列表的回复:
这个Freebase转储应该解压,拆分,并通过修复脚本运行。更多详细信息请点击此处
http://people.apache.org/~andy/Freebase20121223
https://stackoverflow.com/questions/14629667
复制