腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
解释
什么
是
Hadoop
和
Map
/
Reduce
最
简单
的
方法是
什么
?
、
、
、
从高层角度
解释
NoSQL非常容易--它基本上
是
“键值”存储。当然有上千个小
的
和
重要
的
东西,但一般来说,它只是键值存储。
解释
Hadoop
和
Map
/
Reduce
的
最佳方式是
什么
?可能
是
一些“真实世界”
的
例子,即使
是
新手也很容易比较?谢谢!
浏览 0
提问于2010-11-15
得票数 6
回答已采纳
1
回答
Apache Spark与MapReduce
、
、
我一直在查找Spark
和
MapReduce之间
的
区别,我真正发现
的
是
Spark在内存
和
磁盘上运行,这使得它
的
速度大大加快。我还读到,MapReduce对于非常庞大
的
数据集更好,这仅仅是因为你可以将更多
的
数据加载到磁盘上而不是内存中?但想必,使用Spark,您无论如何都会在内存
和
磁盘之间移动数据,因此如果内存空间不足,您可以将一些数据移回磁盘,然后引入新数据进行处理。 基本上,还有没有真正
的
理由继续使用MapReduc
浏览 0
提问于2018-05-02
得票数 0
1
回答
have有自己
的
map
reduce
程序吗?
、
、
、
我想在我
的
应用程序上实现hive+
hadoop
的
map
reduce
程序,我还在想,因为我已经尝试了很多次关于hive中
map
reduce
程序
的
查询
和
查找信息。我
的
问题
是
,hive有自己
的
map
reduce
程序吗?因为当我尝试有点复杂
的
查询时,日志
是
这样
的
: Job running in-
浏览 3
提问于2011-05-26
得票数 1
回答已采纳
2
回答
什么
是
适合我
的
索引
和
处理大数据
的
工具?
、
、
我正在尝试索引
和
存储大数据,但我对使用
什么
工具感到有点困惑。首先我要说
的
是
,我
是
一个新手,在这个主题上只有理论知识。我想:2)使用三台不同
的
PC从平面文件中提取日志数据a)在尝试对三个字段进行索引时,是否可以使用
map
- index -
reduce
?如果不
浏览 0
提问于2015-05-01
得票数 2
4
回答
Map
Reduce
插槽定义
、
、
、
、
我正在成为cloudera
Hadoop
管理员
的
路上。从我开始,我听说了很多关于在
Hadoop
集群中计算每台机器
的
插槽,比如定义
Map
插槽
和
Reduce
插槽
的
数量。我在互联网上搜索了一段时间,以获得
Map
Reduce
插槽
的
Noob定义,但没有找到。 通过PDF
解释
Map
Reduce
的
配置,我真的很生气。请
解释</em
浏览 1
提问于2014-08-16
得票数 5
2
回答
hadoop
如何将作业分发到
map
和
reduce
、
有人能
解释
一下
hadoop
是
如何决定将作业传递给
map
和
reduce
的
吗?
Hadoop
作业被传递到
map
和
reduce
上,但我不能弄清楚它是如何完成
的
。 提前谢谢。
浏览 0
提问于2015-06-06
得票数 0
1
回答
map
reduce
从ftp读取文件
、
、
、
、
我们有一个从FTP服务器下载文件
的
应用程序。我们计划使用
Map
reduce
从ftp下载文件来提高它
的
效率。我
的
第一个问题
是
,使用
Map
reduce
真的可以提高效率吗?我们在逻辑上争论
的
是
,多个映射器
和
每个映射器中
的
一个读取通道实际上会使并行下载过程更快。但我们不确定是否存在技术障碍。有
什么
建议吗?
浏览 2
提问于2012-11-20
得票数 0
回答已采纳
1
回答
在非集群计算机上编译
Hadoop
MapReduce并在
Hadoop
集群上运行。
、
、
、
、
我已经阅读了很多关于
Hadoop
的
文档
和
信息,但是我不知道如何实现这个
简单
的
工作流: 我希望能够将这些MapReduce作业集成到外部应
浏览 4
提问于2016-01-04
得票数 0
回答已采纳
1
回答
在
hadoop
上探索nutch
、
用
Hadoop
和
Nutch作为搜索引擎,我能做
什么
呢?我知道nutch
是
用来构建网络爬虫
的
。但我找不到完美的照片。我可以在nutch中使用mapreduce并执行一些mapreduce工作吗?
浏览 0
提问于2011-09-27
得票数 0
回答已采纳
2
回答
Hadoop
流永远不会结束
、
、
我正在尝试学习如何使用
hadoop
流媒体。我正在尝试运行一个非常
简单
的
映射器,而不是reducers。我认为这意味着节点管理器不得不终止作业,但不确定。我在过去等待了半个小时,但它从来没有结束。我使用
的
是
hadoop
1.2.1。文档上说它附带了
hadoop
streaming jar,但我找不到它,所以我从中央maven存储库下载了
hadoop
-streaming-1.2.1。下面
是
命令行: [msknapp@localhost d
浏览 1
提问于2013-12-22
得票数 2
3
回答
使用或不使用Hive处理Amazon EMR中
的
日志
、
、
、
我
的
EMR集群中有很多日志文件位于路径‘hdfs://logs’。每个日志条目都是多行
的
,但是有一个开始
和
结束标记在两个条目之间划分。现在, Hive负责Mappers
和
浏览 5
提问于2012-12-21
得票数 0
回答已采纳
2
回答
为
什么
hadoop
map
任务上
的
更多内存会使mapreduce任务变慢?
、
、
、
、
为
什么
我在mapreduce.
map
/
reduce
.ememy.mb中
的
mapred-site.xml
和
mapreduce.
map
/
reduce
.java.opts上配置
的
值大于默认值,会使我
的
工作变慢但是如果我把它配置得太低,那么我
的
任务就会失败。我认为在这种情况下,我在
hadoop
上
的
内存配置
是
没有必要
的
…… 你能给我一个
浏览 0
提问于2015-05-13
得票数 0
5
回答
Hadoop
的
变体
我
的
一个项目
是
比较
Hadoop
的
不同变体,据说有很多不同
的
变体,但谷歌搜索对我来说效果不好: 有人知道
Hadoop
的
任何不同变体吗?我唯一找到
的
就是Haloop。
浏览 1
提问于2011-10-08
得票数 0
1
回答
hadoop
的
糟糕
的
任务调度
、
、
我正在
hadoop
上运行一些
map
reduce
任务。映射器用于生成数据,因此不依赖于hdfs块
的
位置。为了测试我
的
系统,我使用了2个节点
和
一个主节点。我正在使用yarn在
hadoop
-2.0上进行测试。 我发现
hadoop
有一些非常不舒服
的
地方。我已经将它配置为运行8个地图任务。不幸
的
是
,
hadoop
在一个节点上启动了所有8个
map
任务,而另一个节点几乎
浏览 3
提问于2014-02-08
得票数 1
2
回答
为
什么
Hadoop
map
reduce
作业中允许
的
计数器数量有限制?
、
、
我正在使用
Hadoop
map
-
reduce
,当我尝试以编程方式创建许多作业计数器时,我得到了一个CountersExceededException。我知道我可以通过配置文件增加允许
的
计数器数量,但有谁知道:
和
b)增加
map
-
reduce
计数器
的
最大数量是否
是
一个好主意?我使用
的
是
hado
浏览 2
提问于2012-06-28
得票数 5
回答已采纳
1
回答
为
什么
要同时映射
和
减少运行?
、
我
是
Hadoop
的
新手。我记得我从某个地方了解到,在
Hadoop
中,所有的映射函数都必须完成,然后才能开始使用减约函数。但是,当我运行这样一个地图还原程序时,我得到了打印输出:
map
(20%),
reduce
(7%)
map
(38%),
reduce
(17%)
map
(40%)
浏览 0
提问于2013-09-13
得票数 5
回答已采纳
4
回答
Python并行处理库
、
、
Python似乎有来帮助在基于SMP
的
系统上或跨集群进行并行处理。我对构建一个客户机-服务器系统很感兴趣,在这个系统中,服务器维护一个作业队列,客户机(本地或远程)连接并运行作业,直到队列为空。在上面列出
的
软件包中,哪个
是
推荐
的
,为
什么
? 编辑:特别是,我写了一个模拟器,它接受一些输入并处理一段时间
的
事情。我需要从模拟中收集足够
的
样本来估计用户指定
的
置信区间内
的
平均值。为了加快速度,我希望能够在许多不同
的
系统上运行模
浏览 1
提问于2010-01-13
得票数 5
回答已采纳
1
回答
Hadoop
中
的
流或自定义Jar
、
、
、
、
我在
Hadoop
中运行一个流作业(在Amazon
的
EMR上),使用Python编写
的
映射程序
和
缩减程序。我想知道如果我在Java (或使用Pig)中实现相同
的
映射器
和
reducer,我会体验到
什么
速度提升。我不是在寻找Java
和
Python之间
的
比较,而是在
Hadoop
中
的
自定义jar部署
和
基于Python
的
流之间
的
比较。我
的
工
浏览 0
提问于2011-07-29
得票数 11
回答已采纳
1
回答
AWS Elastic MapReduce
和
AWS Kinesis Data Analytics有何区别?
、
、
、
我认为两者都可以通过正确
的
配置来完成完全相同
的
任务。Kinesis Data Analytics是否做了EMR不能做
的
事情,反之亦然?Amazon Kinesis Data Analytics
是
分析流数据、获得可操作
的
洞察并实时响应业务
和
客户需求
的
最
简单
方法。Amazon Elastic
Map
Reduce
提供了一个托管
的
Hadoop
框架,使其能够轻松、快速且经
浏览 29
提问于2019-05-17
得票数 7
2
回答
如何在
Hadoop
中将参数传递给主程序
、
、
每次运行
Hadoop
程序时,我都需要更改映射器
和
减法器
的
数量。有没有办法从命令行(当我运行程序时)将映射器
和
缩减程序
的
数量传递给我
的
程序,然后使用args检索它?
浏览 8
提问于2013-05-28
得票数 4
点击加载更多
相关
资讯
Map 和 Reduce 函数的作用是什么?
简单解释:什么是API?
什么是吸引力,这是我看过最精辟的解释
《编程最简单了》1.什么是编程?
什么是python的全局解释锁?
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券