腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(22)
视频
沙龙
1
回答
建立一个分析来自多个源的时间流数据流的体系结构
、
、
、
、
在AWS方面,以下方面的最佳做法是:数据是时间序列数据( 通道X样本的一个矩阵,可以有数百万个样本和几十个通道)。每个数据集大约为5GB。访问数据文件执行接受数据文件并产生结果(另一个文件或JSON)的代码(版本托管) - Perform N more analysis ste
浏览 0
提问于2021-12-20
得票数 0
1
回答
用于haoop集成的cassandra客户端是什么?
、
、
、
我们有许多使用亚马逊
弹性
mapreduce
(EMR)的
mapreduce
作业,这些工作将以很大的容量从cassandra读取/写入数据。
mapreduce
作业可能读或写较重的qps (>1000 qps)。所需经费如下: 我找不到任何权威的信息来源来回答这个问题。
浏览 1
提问于2013-05-01
得票数 3
3
回答
如何在
MapReduce
中的数据块之间进行数据分区和分布?
、
、
、
我是
MapReduce
新手,我的任务是处理大数据(记录行)。我应该使用的一件事是映射器中特定记录的行号,然后根据映射器处理行号信息。例如,假设现在我有一个非常
大
的input.txt,每一行如下所示: 1.我已经查阅了几个教程,我仍然对
mapreduce
的确切工作流程感到困惑。此外,我还计划使用Amazon
弹性
mapreduce
和Python。
浏览 5
提问于2014-05-22
得票数 0
1
回答
在
MapReduce
中,数据是如何在数据节点之间分布的?
、
、
我是
MapReduce
新手,我的任务是处理大数据(记录行)。我应该使用的一件事是映射器中特定记录的行号,然后根据映射器处理行号信息。例如,假设现在我有一个非常
大
的input.txt,每一行如下所示: 1.我已经查阅了几个教程,我仍然对
mapreduce
的确切工作流程感到困惑。此外,我还计划使用Amazon
弹性
mapreduce
和Python。
浏览 2
提问于2014-05-22
得票数 1
1
回答
将大型文件(~6GB)从S3复制到
弹性
MapReduce
集群的每个节点
、
、
、
、
结果发现,在引导操作中,将一个大型文件(~6GB)从S3复制到
弹性
MapReduce
集群中的每个节点并不能很好地扩展;管道只有这么
大
,而且随着节点数量的增加,下载到节点的速度也会变慢。
浏览 4
提问于2014-05-21
得票数 1
回答已采纳
4
回答
多个AWS EC2实例之间的共享存储
、
、
、
、
我面临着在多个EC2实例之间共享存储的问题。我将不得不运行繁重的工作,所以我需要很多实例来完成它。一方面,我将一个EBS卷附加到一个服务器实例中。另一方面,我有一个工人实例。我创建了这个工作者实例的AMI,然后创建了这个AMI的几个实例副本。都运行在同一个VPC上。基本上,服务器实例正在发送作业,而工作人员正在执行作业。当我的工作人员运行作业时,我想在共享存储中保存一些日志文件,如下所示:工人2/ logfile.log
浏览 0
提问于2013-07-02
得票数 8
回答已采纳
1
回答
在不同的机器组上运行Mappers和减速器
、
、
、
、
我们有一个好的,
大
的,复杂的
弹性
-地图还原工作,在硬件上有很大的不同的限制,为Mapper vs收集器与减速机。因此,问题是: 有没有一种方法可以防止减速器在所有映射器完成之前启动?
浏览 0
提问于2014-04-12
得票数 0
回答已采纳
3
回答
火花性能优势与Hadoop
MapReduce
的比较
、
我听说星火有一个优势比hadoop,因为火花的内存计算。然而,一个明显的问题是,并非所有的数据都可以容纳到一个计算机的内存。星火也是如此,仅限于较小的数据集。同时,也有火花集群的概念。因此,我没有遵循所谓的火花相对于hadoop先生的优势。
浏览 10
提问于2017-03-12
得票数 0
回答已采纳
2
回答
它是不是真正的Hadoop框架不适合实时操作?
、
、
、
、
我在一个博客上读到,它说
浏览 8
提问于2015-01-26
得票数 1
回答已采纳
2
回答
将大量数据索引到
弹性
搜索中
、
、
、
、
我很清楚ES的
大
容量API,而且在Java中使用bulk和
MapReduce
仍然需要花费很多天(至少一周左右)。我可以用火花代替,但我不认为它会有很大帮助。
浏览 1
提问于2016-12-15
得票数 1
回答已采纳
5
回答
缓存是星星之火唯一的优势吗?
、
、
我已经开始学习Apache,这个框架给我留下了深刻的印象。尽管困扰我的一件事是,在所有星火演示文稿中,他们都谈到了Spark如何缓存RDDs,因此需要相同数据的多个操作比Map等其他方法更快。为什么要创建一个新的框架呢?
浏览 3
提问于2014-07-11
得票数 17
回答已采纳
1
回答
亚马逊网络服务
弹性
MapReduce
下配置单元查询性能低下
、
、
、
、
我正在运行一组AWS Elastic
MapReduce
集群,并且我有一个包含大约16个分区的Hive Table。最初,从s3distcp到HDFS的压力非常
大
,所以我采取了一些措施(读取:调整到容量更大的机器,然后将dfs权限设置为3倍复制,因为它是一个小集群,并将块大小设置为64MiB)。在
弹性
MapReduce
下的蜂窝中需要采取什么措施来解决这个问题? 谢谢
浏览 1
提问于2013-05-12
得票数 0
4
回答
腾讯云服务器有什么用途?
各位大神,我想问一下个人的腾讯云有什么用途???
浏览 4698
提问于2017-04-03
3
回答
如何在aws电子病历上使用-libjars?
、
Stack溢出上也有类似的问题,但是没有一个回答这个问题。如果按照下面的链接,我们需要使用export _CLASSPATH=/path/jar2 1:/path/jar2 2来使其工作,就会出现问题。因此,如何执行export _CLASSPATH=/path/jar1 1:/path/jar1 2使-libjars选项工作。我尝试在使用自定义jar时执行此操作,但它提供了异常java.lang.NoClassDefFoundError: org/json/simple/parser/JSONParser。 这就是我在
浏览 4
提问于2014-07-24
得票数 2
回答已采纳
2
回答
这个云服务器有什么用?
例如我人在广东,用的广东移动宽带,想玩剑灵网通一区,服务器在北京,利用云服务器我能大大降低延迟吗?具体降低效果如何?会实现本地人延迟?
浏览 1641
提问于2018-01-12
2
回答
我们如何从传递Hadoop流的参数?
、
、
、
、
response = $emr->add_job_flow_steps($JobFlowId, array( 'Name' => '
MapReduce
浏览 4
提问于2012-04-02
得票数 1
回答已采纳
6
回答
用于集群中共享的分布式事务和/或数据的Java解决方案
、
、
、
、
聚类/分发Java服务器应用程序的最佳方法是什么?我正在寻找一种方法,允许您通过添加更多的应用程序服务器和更多的数据库服务器水平扩展。 “最佳”解决方案将允许您为单个节点编写Java应用程序,并希望“隐藏”访问/锁定共享数据的大部分
浏览 9
提问于2009-10-23
得票数 21
7
回答
极慢的S3从EMR/火花写入时间
、
、
、
sc.hadoopConfiguration.set("
mapreduce
.fileoutputcommitter.algorithm.version", "2") 向本地HDFS写入是快速的。
浏览 16
提问于2017-03-15
得票数 35
10
回答
什么是蜂窝:从org.apache.hadoop.hive.ql.exec.MapRedTask返回代码2
、
、
配置单元控制台的完整输出:Launching Job 1 out of 1 Number of reduce tasks determined at
浏览 0
提问于2012-06-25
得票数 73
回答已采纳
16
回答
SaaS,PaaS和IaaS是什么?附例
、
、
、
以下术语是什么意思?
浏览 63
提问于2013-05-29
得票数 402
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
弹性MapReduce
文化创意促升级(新春走基层)
迎新春促消费!大众号同题作文邀请你走进这场新春消费盛宴
年终大促!
新春开工的正确姿势 一丝不苟促项目建设
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券