腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
火花基本面
、
、
在复习基本面时,我不太清楚一些基本
的
事情: 查询1.对于
分布式
处理--可以不使用
HDFS
-
Hadoop
文件系统
而在集群上工作(比如创建自己
的
分布式
文件系统
),还是需要一些基本
的
分布式
文件系统
,如
HDFS
查询2.如果我们已经在
HDFS
中加载了一个文件(作为
分布式
块),那么Spark将再次将其转换为块,并在其级别上
重新
分发(用于
浏览 7
提问于2015-08-24
得票数 1
回答已采纳
1
回答
查找火花作业输出文件
的
位置
、
我正在AWS上
的
EMR集群
中
测试火花放电作业。目标是使用Lambda函数触发火花作业,但现在我正在手动运行火花作业。因此,我将SSH发送到主节点,然后运行spark作业,如下所示:我
的
桶参数传递给火花作业。
hdfs
://ip-xxx-xx-xx-xx.ec2.internal:8020/home/
hadoop
/o
浏览 4
提问于2019-12-03
得票数 0
1
回答
hadoop
在windows上,如何将D:\folder1和E:\folder1添加到
hdfs
?
hadoop
fs -put popularNames.txt /user/
hadoop
/dir1/popularNames.txt 我
的
文件夹非常大,大约有3 TB。我不想复制文件夹,我想将
hdfs
设置到该位置。怎么做呢?
浏览 0
提问于2016-06-25
得票数 0
8
回答
"
hadoop
fs“shell命令和"
hdfs
dfs”shell命令有什么区别?
、
它们应该是相等
的
吗?jenkins在Mon Apr 22 10:48:26 PDT 2013编译
的
Hadoop
2.0.0-mr1-cdh4.2.1 Subversion git://ubuntu-slave07
浏览 138
提问于2013-08-09
得票数 118
回答已采纳
2
回答
HDFS
和
Hadoop
1.0.3
中
的
疑问
、
、
然后是$
HADOOP
_HOME/bin/start-all.sh。) 我使用put将文件放在
HDFS
中
。Q5.)我创建
的
这些文件位于/user/yv/
中
。它们到底在/user/yv/在哪里?它们是否在我
的
核心-
浏览 2
提问于2012-10-02
得票数 0
回答已采纳
2
回答
MapReduce
中
输入拆分
的
主要原因是什么?
、
、
在
中
描述了输入文件被划分为M个输入分割。我知道
Hadoop
中
的
HDFS
自动对64MB
的
块进行
分区
(默认),然后将这些块复制到集群
中
的
少数其他节点,以提供容错。我想知道
HDFS
中
的
这种文件
分区
是否意味着在提到
的
MapReduce论文中描述
的
输入拆分。容错是造成这种分裂
的
唯一原因,还是有更重要
的
原
浏览 0
提问于2012-10-15
得票数 4
回答已采纳
1
回答
Spark支持gzip格式吗?
、
、
、
、
对于大数据项目,我计划使用,它有一些很好
的
功能,比如重复工作负载
的
内存计算。它可以在本地文件上运行,也可以在
HDFS
上运行。有没有办法手动实现gzipped文件
的
读取,或者在读取.gz文件时解压已经自动完成了?
浏览 1
提问于2013-04-30
得票数 46
回答已采纳
1
回答
卡桑德拉与
Hadoop
、
Cassandra使用Cassandra
文件系统
(CFS),
Hadoop
使用
Hadoop
分布式
文件系统
(
HDFS
)卡桑德拉可以用
HDFS
代替CFS?
浏览 0
提问于2014-04-03
得票数 0
1
回答
如何指定在提交Spark应用程序时从
HDFS
读取数据
的
位置?
、
我已经成功地部署了spark集群,但是对于如何在从服务器上分发我
的
HDFS
数据感到困惑吗?是否需要手动将数据放在从节点上,以及如何指定从客户端提交应用程序时从何处读取数据?我已经搜索了多个论坛,但没有找到如何在没有使用
Hadoop
的
情况下使用
HDFS
与Spark。
浏览 0
提问于2017-12-03
得票数 0
回答已采纳
1
回答
在Tez
中
运行"count(*)“时行为上
的
差异
、
、
、
我在
Hadoop
分布式
文件系统
路径和相关
的
hive表上有一个文件。这张桌子两边有30个隔板。我从
HDFS
中
删除了5个
分区
,然后在hive表上执行"msck repair table <db.tablename>;"。它完成了精细但输出 我尝试运行select count(*) <db.tablename>; (在tez上
浏览 1
提问于2019-08-27
得票数 1
回答已采纳
2
回答
Hadoop
(
HDFS
) -文件版本控制
、
、
在给定
的
时间,我
的
应用程序中有用户
文件系统
(apache )。随着它
的
规模越来越大,我怀疑是否要迁移到
hadoop
(
HDFS
),因为我们还需要运行一些统计数据。问题:当前
文件系统
提供文件
的
版本控制。在
HDFS
中
是否已经有什么可用于管理文件版本
的
东西了,还是我真的必须自己编写它(不想
重新
发明热水,但也找不到合适
的
解决方案)。答案 有关详细信息,请参见下文对答复<e
浏览 7
提问于2017-03-13
得票数 5
回答已采纳
1
回答
本机
文件系统
上
的
Spark行为
、
、
我们正在试验在我们
的
项目中运行Spark,没有
Hadoop
,也没有像
HDFS
这样
的
分布式
存储。Spark安装在具有10核和16 on
的
单个节点上,并且该节点不属于任何群集。假设Spark driver占用2个内核,其余
的
在执行时被执行器(每个2个)消耗。如果我们处理存储在Spark本地磁盘
中
的
一个大CSV文件(大小为1 GB)作为RDD,并将其
重新
分区
到4个不同
的
分区</e
浏览 10
提问于2019-02-01
得票数 0
回答已采纳
1
回答
如何在现有系统
中
实现
Hadoop
框架
、
、
、
、
我计划在我
的
基于web
的
应用程序
中
实现
Hadoop
框架。但我只是将其托管在本地主机
中
。我计划实现mapreduce和
hdfs
作为
分布式
文件系统
。问题是,我要做
的
第一步是什么?我应该从什么开始呢?我对
Hadoop
框架进行了深入
的
研究。了解它是如何工作
的
,并尝试使用互联网上
的
wordcount示例。
浏览 2
提问于2015-02-04
得票数 0
1
回答
Hadoop
到底是干什么用
的
,主要
的
应用场景和应用领域是什么?
Hadoop
到底是干什么用
的
,主要
的
应用场景和应用领域是什么,主要解决
的
核心问题又是什么,我们个人可以用它来干什么 产生价值呢?
浏览 960
提问于2020-09-24
0
回答
上传文件到
HDFS
是否会自动以
分布式
方式存储文件?
、
我刚刚开始学习
Hadoop
,我对如何以
分布式
方式存储数据感到有点困惑。我有MPI背景。对于MPI,我们通常有一个主处理器,它将数据发送到各种其他处理器。这是由程序员显式完成
的
。有了
Hadoop
,您就拥有了
Hadoop
分布式
文件系统
(
HDFS
)。那么,当您将本地服务器
中
的
某些文件放入
HDFS
时,
HDFS
是否会自动以
分布式
方式存储此文件,而无需程序员执行任何操作?<e
浏览 8
提问于2019-01-26
得票数 1
回答已采纳
2
回答
在
hadoop
的
映射阶段写入本地文件
、
Hadoop
将中间结果写入本地磁盘,将reducer
的
结果写入
HDFS
。
HDFS
是什么意思。它在物理上翻译成什么?
浏览 1
提问于2012-09-14
得票数 0
回答已采纳
1
回答
在Amazon EMR
中
,Hue
中
的
文件存储在何处
、
、
如果我转到http://ec2-****:8888/hue/home/上
的
色调链接,我可以访问色调仪表板,创建和保存文件等。但是,当我使用SSH浏览系统时,我无法看到这些文件。这些文件存储在系统
中
的
什么位置?
浏览 1
提问于2020-11-12
得票数 4
4
回答
对于火花工作负载是否需要
HDFS
?
、
、
、
、
HDFS
并不是必要
的
,但在某些地方出现了建议。将
HDFS
用于火花工作负载有什么好处?
浏览 8
提问于2015-09-19
得票数 5
8
回答
Hadoop
和HBase
、
你好,我是hbase和
hadoop
的
新手。我找不到为什么我们要在hbase上使用
hadoop
。我知道
hadoop
是一个
文件系统
,但是我读到我们可以在没有
hadoop
的
情况下使用hbase,那么我们为什么要使用
hadoop
呢? thx
浏览 1
提问于2012-05-19
得票数 10
回答已采纳
1
回答
是否可以从非
HDFS
文件系统
HBASE连接
HADOOP
?
、
、
、
hbase-site.xml @HBase
的
配置<property> <value>file:///D:/LocalData/
浏览 1
提问于2015-03-24
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hadoop分布式文件系统(HDFS)基础概念讲解
深度分析分布式文件系统(Hadoop HDFS)客户端写入机制
Hadoop 介绍
Hadoop HDFS操作
10小时入门大数据
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券