我正在尝试通过Neo4j中的apoc库读取位于我的hdfs文件系统中的csv文件,代码如下:“
CALL apoc.load.csv('hdfs://ipAddrress:port/myFileLocation.csv')
我还禁用了apoc的Neo4j配置,并启用了通过apoc导入文件。因此,我在配置文件中包含了以下几行:
apoc.import.file.use_neo4j_config=false
apoc.import.file.enabled=true
但我一直收到以下错误:
Failed to invoke procedure `apoc.load.csv`: Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.fs.FSDataOutputStream
依赖项内置于hadoop apoc扩展中,但我不知道为什么找不到与neo4j相关的类。有什么帮助吗?
发布于 2020-07-16 08:37:41
在互联网上搜索了一下后,我从Tom Geudens那里找到了这个。
CSV文件可以存储在数据库服务器上,然后可以使用file:///
进行访问。此外,LOAD CSV还支持通过HTTPS、HTTP和FTP访问CSV文件。您也许能够通过http公开您的hdfs文件系统(然后使用http:// url),但在其他情况下...不是,
https://stackoverflow.com/questions/62913658
复制