腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Hadoop
API
在
尝试
初始化
群集
以
使用
DistCp
时
抛出
错误
、
、
、
、
我正在
尝试
使用
Hadoop
API
通过
DistCp
类执行分布式复制,但在
尝试
连接到集群
时
抛出
错误
。我
尝试
更改
hadoop
和hdfs的配置文件,但似乎不起作用。;import org.apache.
hadoop
.tools.
DistCp
; import org.apache.
浏览 13
提问于2018-07-24
得票数 2
回答已采纳
1
回答
hadoop
distcp
异常无法重命名tmp文件
、
、
、
我正在
尝试
使用
distcp
命令将数据从一个cdh(CDH4.7.1)集群移动到另一个cdh(cdh5.4.1)集群,如下所示:
使用</em
浏览 6
提问于2016-02-19
得票数 0
6
回答
如何将数据从一个HDFS复制到另一个HDFS?
、
、
、
我有两个HDFS设置,并且希望将一些表从HDFS1复制(而不是迁移或移动)到HDFS2。如何将数据从一个HDFS复制到另一个HDFS?可以通过Sqoop或其他命令行实现吗?
浏览 4
提问于2015-08-07
得票数 26
1
回答
Hadoop
distcp
错误
、
、
、
我正在
尝试
在
两个启用kerberos的
Hadoop
集群之间执行
hadoop
Distcp
(版本-
Hadoop
2.0.0-cdh4.3.0)Copy failed: java.io.IOException: Faile
浏览 1
提问于2014-01-22
得票数 2
1
回答
如何在MAPR文件系统和HDInsight Blob存储之间进行区分
、
、
、
我正在
尝试
执行下面的
distcp
命令,但是它
抛出
了异常:
hadoop
distcp
date_load=201901* wasb://dev3-spark@clusterdev.blob.core.windows.net/luiz/producao/performance/performance_report
抛出
的异常如下: 我正在
尝试
执行下面的
distcp
命令,但是它
抛出</em
浏览 16
提问于2019-02-06
得票数 0
回答已采纳
1
回答
使用
mapr客户端的节点是否需要访问我想要
使用
distcp
复制的文件?
、
情况:节点1到10 :安装了mapr NodeManager的mapr集群节点。每个节点都在/mnt/resource/下挂载了外部资源当我
在
Node 0上执行相同的代码
时</e
浏览 9
提问于2020-11-24
得票数 0
2
回答
使用
spark跨
hadoop
群集
复制数据
、
、
、
、
我遇到了这样的情况:我必须将数据/文件从PROD复制到UAT (
hadoop
群集
)。为此,我现在
使用
'
distcp
'。但这需要永远的时间。由于
distcp
在
幕后
使用
map-reduce,有没有办法
使用
spark使这个过程更快呢?就像我们可以将hive执行引擎设置为'TEZ' (
以
取代map-reduce)一样,我们可以将
distcp
的执行引擎设置为spark吗?或者,
浏览 1
提问于2016-08-19
得票数 0
2
回答
Hive,HDFS数据到本地系统并返回
、
、
、
我是
Hadoop
政府的新手:) 我有一个由8个节点组成的ApacheHadoop2.4.1集群,
使用
了16 nodes (无法在任何xml文件中找到复制因子),Hive0.13具有MySQL转移。根据我的理解,
distcp
在
HDFS级别工作,所以我不确定是否可以
使用
它来更快地复制HDFS到NFS和NFS到新的HDFS。
浏览 4
提问于2015-02-05
得票数 1
1
回答
通过com.google.cloud.
hadoop
.fs.gcs.GoogleHadoopFileSystem导致NoClassDefFoundError:无法
初始化
类
hadoop
distcp
、
、
我正在
尝试
使用
hadoop
Java Library
在
我的
Hadoop
集群上运行
distcp
命令,
以
将内容从HDFS移动到Google Cloud Bucket。我收到
错误
NoClassDefFoundError: Could not initialize class com.google.cloud.
hadoop
.fs.gcs.GoogleHadoopFileSystem; import org.apache.
hadoop<
浏览 18
提问于2021-11-21
得票数 3
1
回答
在运行
Hadoop
作业
时
出现类加载问题。
、
、
、
、
Submit():用于向YARNRM提交
DistCp
作业
DistCp
distCp
= new
DistCp
(configuration我调试了这个问题,发现当首先调用Query()
API
时
,类LocalClientProtocolProvider和YarnClientProtocolProvider不会被加载。当调用Submit
浏览 6
提问于2015-09-30
得票数 0
回答已采纳
1
回答
使用
python脚本的AWS ETL
、
、
、
、
我正在
尝试
在
使用
python的AWS平台上创建一个基本的ETL。
在
S3存储桶(让我们称它为"A")中,我有很多原始的日志文件。
在
本例中,我希望将它写到另一个存储桶中( "C")。 我
在
摆弄数据管道,试图运行一个shell命令作业和一个用于python脚本排序的hive作业。EMR集群是创建、运行、完成的,没有失败或
错误
,但也没有创建日志,我不能理解哪里出了问题。此外,我希望原始日志在处理并写入目标或
错误
日志存储桶
浏览 2
提问于2015-07-11
得票数 1
2
回答
未写入hdfs目录的单元插入覆盖查询:无法获取
DistCp
构造函数
、
、
我用10毫安行在蜂箱中创建了hbase视图,当我
在
查询下面运行时,会调用
distcp
,它
抛出
的
错误
低于
错误
。/mapred/INPUT/.hive-staging_hive_2016-10-17_14-57-48_620_6609613978089243090-1/-ext-10000到目的地/映射/输入
在
org.apache.
hadoop
.hive.ql.metadata.Hive.moveFile
D
浏览 14
提问于2016-10-17
得票数 0
回答已采纳
1
回答
Amazon :用数据
初始化
集群
、
、
、
我正在
使用
Amazon,我能够
使用
CLI工具创建和运行作业流。工作进展顺利。但是,当试图从S3和name节点的本地文件系统将数据加载到EMR集群的HDFS
时
,我遇到了一个问题。我正在
尝试
使用
S3
DistCp
工具来完成这个任务。/'at org.apache.
hadoop
.ipc.Server$Handler.
浏览 3
提问于2012-05-30
得票数 3
2
回答
移动另一个框中的
hadoop
主节点:如何处理HDFS
、
我有一个小型
hadoop
集群,其中有一个主节点和一个从节点,由于某种原因,主机箱必须移动到另一台机器上。我是否必须移动目标机器上的
hadoop
_tmp文件(我的hdfs所在的位置)?或者集群将通过从服务器复制文件来重建?我担心的是有一个不一致的hdfs,什么是最好的?
浏览 5
提问于2016-10-24
得票数 0
回答已采纳
1
回答
为什么
Hadoop
hftp要服务目录而不是文件?
、
为了消除网络和防火墙问题的可能性,我
在
源服务器上
使用
hadoop
fs -ls和
hadoop
fs -cat命令来
尝试
解决这个问题。812 2012-12-16 17:21 logfiles/day_id=19991231/hour_id=1999123123/000008_0cat: HTTP_OK expected, received 500 下面是当我
尝试
浏览 0
提问于2012-12-19
得票数 2
回答已采纳
1
回答
在
Cloud中调整工作节点大小后如何更新火花配置
、
、
、
我注意到这两个工作节点没有被充分
使用
。特别是,
在
第一个辅助节点上只有2个执行程序,
在
第二个辅助节点上只有一个执行程序,spark.executor.memory 4655m而且,web控制台的DataProc页面上的信息也不会自动更新。
浏览 0
提问于2016-08-03
得票数 6
回答已采纳
4
回答
如何将数据从CDH3集群迁移到(不同的) CDH4集群?
、
、
我希望将数据从CDH3复制到CDH4 (
在
另一台服务器上)。我的CDH4服务器的设置使得它无法看到CDH3,所以我必须将数据从CDH3向上推到CDH4。(这意味着我不能从CDH4运行
distcp
命令来复制数据)。如何通过
在
较低版本的CDH4
hadoop
上运行命令将数据转移到CDH3的HDFS,或者这是不可能的?
浏览 10
提问于2014-02-05
得票数 0
回答已采纳
2
回答
hadoop
distcp
不工作,MR作业处于已接受状态
、
、
、
我正在
尝试
将数据从CDH4复制到CDH5
群集
。当我从CDH5提交
distcp
作业
时
,MR job进入已接受状态并停留在那里(我已经
尝试
了多次,它停留在那里超过15小
时
)。我要复制的数据小于10MB。下面是我正在
使用
的设置和步骤。来源: CDH4,例如NodeName = cloudera4目的地: CDH5,例如NodeName = Cloudera1
在
Cloudera1上
使用
的命令:
hadoop
dis
浏览 1
提问于2015-03-07
得票数 0
3
回答
S3
DistCp
作业失败:-- dest不匹配
、
、
、
、
我正在
尝试
使用
s3
DistCp
将一个S3文件夹中的一些小文件合并到另一个S3文件夹中。脚本类似于以下内容:/home/
hadoop
/lib/emr-s3
distcp
-1.0.jar\--groupBy,[0-9]*,\但我得
浏览 1
提问于2013-10-21
得票数 1
1
回答
从jsp servlet运行mapreduce作业
、
、
、
、
我有一个简单的java程序,它将
distcp
包装在
hadoop
集群上复制文件。我可以
在
IDE和
hadoop
中成功地运行它。现在的问题是,每当程序想提交
distcp
作业
时
,它都会出现以下
错误
:at org.apache.
hadoop
.tools.
DistCp
.createMetaF
浏览 3
提问于2017-06-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HBase应用与发展之HBase应用与高可用实践
大数据公司 LiveRamp 上云记(四):如何在迁移时处理数百万请求和 PB 级数据传输
EF 6.x和EF Core如何比较TimeSpan格式的字符串?
HBase应用与高可用实践
分布式文件系统的备份
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券