腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
模拟Map
Reduce
环境
、
为了设计一些算法,我需要模拟map-
reduce
环境。我假设我有两个作业,每个作业都由一组map和
reduce
任务
组成。我必须对map和
reduce
任务
的处理时间做出假设。例如,作业"j1“有3个map
任务
和2个
reduce
任务
。那么,map
任务
与
reduce
任务
在处理时间上有什么限制吗?通常是怎么回事?
浏览 0
提问于2012-12-13
得票数 0
回答已采纳
1
回答
map和
reduce
任务
的排序
、
作业j由"M“个map
任务
和"R”个
reduce
任务
组成。
Reduce
(1)
Reduce
(2) ...
Reduce
(R) 您如何知道map和
reduce
任务
之间的顺序?我们知道Map
任务
的输出将是
Reduce
任务
的输入。但是如果我想要模拟排序,我应该怎么做呢?
浏览 0
提问于2012-11-29
得票数 1
回答已采纳
3
回答
map
reduce
中的共享变量
、
、
我需要一个在
reduce
任务
之间共享的变量,每个
reduce
任务
都可以原子地读写它。我需要这样一个变量的原因是为
reduce
任务
创建的每个文件提供一个唯一的标识符(
reduce
任务
创建的文件数量不是确定的)。 谢谢
浏览 0
提问于2011-08-10
得票数 0
回答已采纳
2
回答
为什么所有的
reduce
任务
都在一台机器上结束?
、
、
我在Hadoop平台(cloudera发行版)中编写了一个相对简单的map-
reduce
程序。除了常规的map-
reduce
任务
之外,每个Map &
Reduce
还将一些诊断信息写入标准输出。但是,当我查看这些日志文件时,我发现Map
任务
相对均匀地分布在节点上(我有8个节点)。但是
reduce
任务
标准输出日志只能在一台机器上找到。我猜,这意味着所有的
reduce
任务
最终都在一台机器上执行,这是有问题的,也是令人困惑的。 有人知
浏览 0
提问于2011-09-01
得票数 0
回答已采纳
1
回答
根据
reduce
任务
或
reduce
方法调用,Mapreduce输出HDFS中的文件数
、
、
我理解了通过编写自定义的partiotiner,我们可以控制
Reduce
Task的数量,从而创建。这很好。但我不能理解的一个问题是在hdfs中生成的输出文件的数量,因此这取决于所谓的
Reduce
任务
的数量或每个
Reduce
任务
的
Reduce
调用的数量。(对于每个
Reduce
任务
,可能会发生许多
reduce
调用)。 如果需要任何其他细节,请让我知道。代码是非常基本的,所以不要张贴它。
浏览 1
提问于2013-10-05
得票数 0
1
回答
不同数量的map
任务
之间没有性能差异(1,2,4.)
、
我是hadoop的新手,正在测试不同数量的map
任务
和
reduce
任务
之间的性能差异。-D mapred.
reduce
.tasks=2和
reduce
是用python编写的,所以我用python指定map
任务
的数量,用python指定
reduce
任务
的数量。问题+----------+----------+----------+ | map |
r
浏览 0
提问于2013-11-28
得票数 1
1
回答
Reduce
任务
并行库“样板”
、
、
我的团队是第一次使用
任务
并行库,我的同事提出了一些类似下面列出的代码。
浏览 4
提问于2014-05-30
得票数 0
1
回答
Hadoop 0.20:“作业设置”
任务
问题是:当我启动Hadoop作业时,需要首先运行“job setup”
任务
。在我看来,Hadoop随机选择了这个
任务
,要么是map
任务
,要么是
reduce
任务
。我们为map
任务
配置了比
reduce
任务
更多的容量,所以每当我不走运,有一个
reduce
启动
任务
时,我的作业甚至要花很长时间才能开始运行。有什么办法可以克服这个问题吗?
浏览 1
提问于2015-04-25
得票数 0
1
回答
hadoop
reduce
任务
如何处理映射分组数据
、
、
Reduce
方法处理来自地图的分组数据。但我想知道
reduce
任务
是如何获取组数据的?如果映射输出许多分组数据,每个
reduce
任务
是否只读取相同数量的组??机制是什么??
浏览 0
提问于2016-04-14
得票数 0
2
回答
是否仅在所有映射器完成时减少作业?
、
、
我有点困惑;
reduce
任务
和
reduce
任务
有什么区别?这就是我的例子;我读到
reduce
只有在所有映射完成后才会开始...但在hadoop输出中,我看到了不同的情况:12/02/11 10:58:54 INFO mapred.JobClient: map 60%
reduce
20% 12/02
浏览 0
提问于2012-04-17
得票数 1
回答已采纳
15
回答
设置map
任务
和
reduce
任务
的数量
、
我目前正在运行一个作业,我将map
任务
的数量固定为20,但获得了更高的数量。我还将
reduce
任务
设置为零,但我仍然得到一个非零的数字。MapReduce作业完成的总时间也不会显示。:48:56 INFO mapred.JobClient: Job Counters 11
浏览 3
提问于2011-07-31
得票数 40
回答已采纳
1
回答
分布式缓存Hadoop和可扩展性
、
不同的
reduce
任务
需要不同的文件。例如,
reduce
1需要文件A,
reduce
2需要文件B,依此类推。在
reduce
类配置方法中,我使用DistributedCache.getCacheFiles()来获取文件。有没有可能在
reduce
1的内存中只有文件A,在
reduce
2的内存中只有文件B。或者在
reduce
任务
开始之前,这两个文件都被添加到内存中。 如果我理解了这一点,我就可以对我的程序使用分布式缓存。我关心的是可伸缩
浏览 1
提问于2012-10-24
得票数 0
回答已采纳
1
回答
设置特定M/R作业的减速机容量
、
我想在每个作业的基础上更改集群的
reduce
插槽的容量。也就是说,最初我为一个
任务
跟踪器配置了8个
reduce
插槽,因此对于一个有100个
reduce
任务
的作业,将会有(8 * datanode number)个
reduce
任务
同时运行。但是对于一个特定的工作,我想将这个数字减少到一半,所以我做到了: conf.set("mapred.tasktracker.
reduce
.tasks.maximum", "4")
浏览 1
提问于2013-05-02
得票数 0
回答已采纳
1
回答
MapReduce映射
、
我正在学习MapReduce框架,并对此有以下问题: curren
浏览 0
提问于2018-03-15
得票数 0
回答已采纳
5
回答
Map
Reduce
中的Map
Reduce
、
、
、
我使用Hadoop开发Map/
Reduce
。我的驱动程序向Hadoop的作业跟踪器提交一个MapReduce作业(包含Map和
Reduce
任务
)。我有两个问题: a)我的Map或
reduce
任务
是否可以提交另一个MapReduce作业?(使用相同的群集Hadoop和到相同的Job Tracker)。这意味着,我的初学者驱动程序提交一个mapreduce作业,在这个作业中,它的map或
reduce
任务
产生另一个MapReduce作业,并将其提交到相同的集群Had
浏览 1
提问于2012-03-15
得票数 2
1
回答
numofreducers在map
reduce
中的使用
、
、
我对map
reduce
有一个简单的疑问。谢谢你的帮忙
浏览 2
提问于2016-05-09
得票数 0
1
回答
映射和减少Hadoop YARN中的
任务
内存设置
、
、
在YARN上的MapReduce应用程序中,
Reduce
任务
的最大内存是否需要超过Map
任务
?就像下面..。mapreduce.map.memory.mb = 7mapreduce.map.java.opts = 0.8 * 7 = 5,6 mapreduce.
reduce
.java.opts
浏览 2
提问于2016-01-03
得票数 1
1
回答
在Hadoop中如何在作业和
任务
级别处理输出文件?
、
、
根据权威指南,OutPutCommitter的setUpJob()将创建mapreduce输出目录,并为
任务
设置临时工作区。Mapred.output.dir/_临时上面的两个陈述有点令人困惑。
浏览 0
提问于2013-12-06
得票数 0
1
回答
hadoop-streaming :处于挂起状态的
reduce
任务
显示“没有
reduce
任务
的空间”。
、
、
、
、
我的map
任务
成功完成,我可以看到应用程序日志,但reducer仍处于挂起状态map 100.00% 200 0 0 200 0 0 / 40当我查看
reduce
任务
时,我看到 All Task
浏览 2
提问于2011-11-01
得票数 0
回答已采纳
2
回答
mapreduce程序中静态变量的使用
、
、
、
、
在我的
reduce
任务
中,我必须使用一个静态变量,因为我希望它被许多线程编辑(这些线程是从
reduce
函数中调用的)。问题是这个变量正在被当前
reduce
任务
的线程编辑,也被其他
reduce
任务
的线程编辑,我想避免这种情况。 所以我的问题是:是否有一种方法或技巧可以仅通过当前缩减程序的线程来修改此变量?
浏览 1
提问于2014-06-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python的sum、map、filter和reduce
MapReduce之Map和Reduce阶段
python snippet:ProgBar,map,reduce,filter
图解Hive sql之map reduce过程
list分片与推导+map&reduce
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券