我从一台Windows7计算机开始,设置了一个Ubuntu Linux虚拟机which I run using VirtualBox。已经执行了The Cloudera Manager Free Edition version 4,我一直在按照localhost:7180上的提示进行操作。
现在,当提示要求我“为您的CDH集群安装指定主机”时,我被卡住了。我可以单独在linux虚拟机中安装和运行所有Hadoop组件吗?
请帮助我指出正确的方向,我应该指定的主机。
我正在使用CDH5.3,我试图编写一个mapreduce程序来扫描一个表并进行一些处理。我已经创建了一个扩展TableMapper的映射程序,我得到的例外是:
java.io.FileNotFoundException: File does not exist: hdfs://localhost:54310/usr/local/hadoop-2.5-cdh-3.0/share/hadoop/common/lib/protobuf-java-2.5.0.jar
at org.apache.hadoop.hdfs.DistributedFileSystem$17.doCall(Distribute
使用hadoop流:
hadoop jar hadoop/contrib/streaming/hadoop-streaming-1.0.3.jar -file mapper.rb -mapper mapper.rb -file reducer.rb -reducer reducer.rb -input textfile.txt -output output
假设我所在的目录是“/home/user/sei/ textfile.txt”和
1) is in the same folder as the directory I am currently in
2) I did not use -
我一直试图运行HBase的例子-明确的指南,我遇到了这个错误,我无法通过它。如果这有帮助的话,我将以独立模式运行。
Exception in thread "main" org.apache.hadoop.hbase.MasterNotRunningException: �
17136@ubuntulocalhost,32992,1373877731444
at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.getMaster(HConnectionManager.j
我一直在努力让Storm的本地副本正常工作,遵循回购指南和这个。
当试图使用mvn compile exec:java -Dstorm.topology=org.apache.storm.starter.ExclamationTopology运行拓扑时,输出最终会继续循环&垃圾邮件:
28534 [Thread-9-SendThread(localhost:2000)] INFO o.a.s.s.o.a.z.ClientCnxn - Opening socket connection to server localhost/127.0.0.1:2000. Will not attem