我运行的任何涉及HBase访问的Spark作业都会导致以下错误。我自己的工作都是在Scala中完成的,但是提供的python示例的结果是一样的。集群为Cloudera,运行CDH 5.4.4。Please look at the previous logs lines from the task's full log for more details.
at org.apache.hadoop.hbase.mapreduce.TableInputFormatBase.createRecordReaderEnsure you call initial
我无法连接到在Docker on Windows (镜像)中运行的HBase。但是,我可以连接到本地安装的HBase。");config.set("hbase.zookeeper.property.clientPort:352)
at org.apache.hadoop.hbase.ipc.RpcClient.getConnection
我的CDH版本是5.1.2,我的Hbase版本是0.98.1,我的Hue版本是3.6.0。我执行了这个pig脚本来从Hue中的Hbase加载数据。按照谷歌指南,我将所有hbase*.jars从文件夹hbase库上传到user/oozie/share/lib/lib_20140822104613/pig,并将以下语句添加到脚本顶部:
set hbase.zookeeper.quorum/hbase-<HBase</e