腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
MapReduce
混频相位瓶颈
、
我正在读原始的
MapReduce
报纸。我的理解是,当使用数百GB的
数据
时,传输这么多
数据
的
网络
带宽可能是
MapReduce
作业的瓶颈。对于映射任务,我们可以通过将映射任务调度到已经包含任何给定拆分的
数据
的工作人员上,从而减少
网络
带宽,因为从本地磁盘读取不需要
网络
带宽。当使用数百个GB或更多
浏览 1
提问于2016-07-05
得票数 0
回答已采纳
1
回答
MapReduce
矩阵乘法复杂度
、
、
、
+---------------------------------+按定义:C_i_j = sum( A_i_k * B_k_j )考虑到
MapReduce
集群中有多个实例--这是估计所提供算法复杂性的最正确的方法吗?当我们假设
MapReduce
集群中的实例数是K时。但是这个估计没有考虑到很多细节:比如
MapReduce
集群实例之间的
网络
带宽,在距离之间分配
数据
的能
浏览 3
提问于2014-05-15
得票数 4
1
回答
在
MapReduce
框架中,为什么不能保证组合器的执行?
、
我是
MapReduce
的初学者。根据我的理解,可以通过在单个Map节点上进行聚合来使用Combiner来提高性能。 我的问题是:组合器会在Map的所有
数据
集上执行吗?还是在
MapReduce
中运行组合器步骤是可选的?
浏览 2
提问于2018-04-10
得票数 0
回答已采纳
2
回答
什么时候在Hbase中使用
MapReduce
?
、
我想从应用程序的角度了解Hbase的
MapReduce
,需要一些它的实际用例来更好地理解编写这些作业的有效用例。 如果有任何解释真实用例的文档或示例的链接,请分享。
浏览 1
提问于2015-05-25
得票数 0
1
回答
MapReduce
不能胜任的任务有哪些?
、
我想知道是否有任何不适合
MapReduce
的任务示例。如果有一些具体的例子就更好了。谢谢!
浏览 4
提问于2012-08-04
得票数 1
回答已采纳
1
回答
是否有人有使用
MapReduce
解决
网络
流量问题的经验
、
、
、
MapReduce
已被证明是以并行/分布式方式解决大
数据
集问题的强大工具。 一些组合优化问题,如最大
网络
流,最小费用
网络
流,多商品最小费用流,或最短距离路径/路径对问题,都能够扩展到非常大的规模。是否有人有成功/失败的经验来应用
MapReduce
来处理这些类型的问题?你能分享一下你的看法吗?用
MapReduce
来解决这类问题是个好主意还是坏主意?
浏览 0
提问于2011-08-10
得票数 2
1
回答
text2vec与RHadoop的兼容性
目前,我们在亚马逊
网络
服务EC2(single instance)中使用text2vec处理大
数据
集,未来文本
数据
会越来越大,我们可能会尝试RHadoop(
MapReduce
)架构,但不知道它是否能兼容text2vec和RHadoop(
MapReduce
)。
浏览 7
提问于2017-08-13
得票数 0
回答已采纳
2
回答
Hadoop
MapReduce
vs MPI ()--什么时候使用其中一种而另一种?
、
、
、
我对并行计算很陌生,刚刚开始在Amazon上试用MPI和Hadoop+
MapReduce
。但我不知道什么时候该用一种而另一种。 但是,我也看到了
MapReduce
on MPI ()的实现,它不提供容错,但在某些基准测试上比在Hadoop上的
MapReduce
更有效,而且似乎使用外存来处理大
数据
。此外,
浏览 5
提问于2015-01-06
得票数 17
回答已采纳
3
回答
地图缩减框架/基础设施
、
、
、
地图减少是一种模式,最近似乎得到了很多牵引力,我开始看到它体现在我的一个项目,重点是一个事件处理管道(iPhone加速度计和全球定位系统
数据
)。
浏览 9
提问于2010-03-15
得票数 6
回答已采纳
1
回答
用于在python中添加计数器的并行化
、
、
有一张要加起来的字典清单。combined_dictionary = {} combined_dictionary = Counter(combined_dictionary) + Counter(dictionary) 我想使用多核,因为list_of_di
浏览 0
提问于2019-05-15
得票数 1
2
回答
为什么Spark将Map阶段输出保存到本地磁盘?
、
、
我想了解下面的w.r.t到Hadoop
MapReduce
。 Hadoop、
MapReduce
和Spark的映射任务的输出有何不同?如果有很多小的中间文件作为输出,那么火花如何处理
网络
和I/O瓶颈?
浏览 6
提问于2016-02-18
得票数 8
1
回答
如何为亚马逊
网络
服务
MapReduce
准备和售后服务
数据
、
、
、
、
我正在与亚马逊的
MapReduce
网络
服务的一个大学项目。为了将
数据
用于
MapReduce
,我需要将它们从关系
数据
库(AWS RDS)转储到S3中。在
MapReduce
完成后,我需要拆分输出文件并将其中的一大块加载到它们自己的S3存储桶中。 在Amazon Web服务环境中执行此操作的好方法是什么?最好的情况:除了用于RDS和
MapReduce
的实例之外,是否可以在不使用额外的EC2实例的情况下实现这一点?我将python用于映射器和reducer函数,并将json说明
浏览 2
提问于2011-01-12
得票数 0
回答已采纳
1
回答
Hadoop :单节点与集群性能
、
、
我在具有3个节点(1个主节点和2个从节点)的Hadoop集群上按顺序运行三个
MapReduce
作业(其中一个是对另一个的输入)。我使用Hadoop流,我的代码在python2.7中。
浏览 0
提问于2013-12-28
得票数 0
回答已采纳
1
回答
什么是
MapReduce
框架?
、
、
、
我有一个项目要做,我必须解释
MapReduce
是如何工作的。 这个名字本身就是"
MapReduce
框架“,这就是问题所在。这是什么意思??
浏览 8
提问于2016-04-07
得票数 0
回答已采纳
2
回答
映射器和还原器类是否需要部署在Hadoop集群的所有节点上?
、
包含Mapper/Reducer类的jar文件是否需要部署在运行Hadoop的所有节点上?还是只在主节点(名字节点)上?
浏览 4
提问于2015-09-14
得票数 0
回答已采纳
1
回答
比较
MapReduce
性能
、
、
、
假设我有一个10k对
数据
(键,值),并搜索具有最佳值的10个
数据
。我认为,这可能是因为
mapreduce
需要更多的服务来运行,需要更多的
网络
活动,需要更多的精力来读取和写入hdfs。还有其他因素可以证明
mapreduce
(在这种情况下)比不使用<
浏览 2
提问于2014-08-31
得票数 2
回答已采纳
1
回答
利用
MapReduce
寻找非对称对
、
、
我试图分析包含follower和followee对的社交
网络
数据
。有人能向我解释如何使用
MapReduce
来从海量
数据
中找到不对称对吗? 非常感谢。
浏览 2
提问于2018-03-21
得票数 0
回答已采纳
2
回答
带堆的
MapReduce
排序
、
、
我试图分析包含follower和followee对的社交
网络
数据
。我想找到十大用户中使用
MapReduce
最多的用户。我用一步userID和number_of_followee做了一对
MapReduce
。有人能解释一下我如何使用
数据
结构对海量
数据
进行排序吗? 非常感谢。
浏览 0
提问于2018-03-20
得票数 0
回答已采纳
1
回答
压缩对
MapReduce
作业有什么影响?
、
Microsoft的白皮书记录了以下内容: 但是,我无法理解“对相同的输入
数据
反复运行
MapReduce
作业”将如何帮助压缩和解压缩的性能?即使每次
数据
不同,压缩也应该具有相同的性能。
浏览 3
提问于2016-06-05
得票数 0
回答已采纳
1
回答
HBase的最小服务器组合是多少?
、
、
HBase的最小服务器组合是多少?我期待着像这样解释。 ..。还有更多
浏览 1
提问于2012-02-22
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
走进大数据Mapreduce中
【大数据知识】MapReduce运行流程
走进大数据 MapReduce之规约
MapReduce 如何处理数据排序?
大数据核心框架MapReduce过程解析
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券