腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1313)
视频
沙龙
1
回答
如
何在
Spark
1.6.2下
控制
不断
增长
的
调度
程序
延迟
?
、
我尝试过不同大小
的
内存和不同数量
的
执行器,例如:每个批处理请求重新处理相同
的
数据集,更新
不断
变化
的
值。也就是说,相同
的
结构,相同
的
大小,相同
的
键,但是值会随着每个批次
的
更新而更新。对于每个请求,从队列读取请求到
浏览 18
提问于2017-01-16
得票数 1
1
回答
火花流-获得批处理级别的性能状态。
、
、
、
我正在设置一个Apache
Spark
集群来执行实时流计算,并希望通过跟踪各种指标(
如
批大小、批处理时间等)来监视部署
的
性能。我
的
Spark
Streaming
程序
是用Scala编写
的
浏览 4
提问于2017-04-11
得票数 2
回答已采纳
1
回答
DAG
调度
器事件循环outOfMemoryerror:使用火花流应用
程序
的
Java堆空间
、
我
的
Spark
Streaming应用
程序
由于OutOfmemoryException: Java Heap Space而
不断
失败。 --class ... \ --deploy-mode cluster \ --total-executor-cores 3 \
浏览 2
提问于2016-10-18
得票数 2
2
回答
Scylladb: Scylla写入
延迟
随着连续批处理写入摄取时间
的
推移而增加
我有一个使用gocql驱动
程序
连续批量将数据注入Scylla
的
用例,在繁重
的
写入测试期间,我观察到scyllas写入响应
延迟
随着时间
的
推移而增加,有时这会导致scylla节点重新启动,在cassandra
的
情况下,
延迟
随着时间
的
推移是恒定
的
。我只想知道这个用例
的
正确配置,这样我就可以在整个时间内实现恒定
延迟
。写入者过程
的
细节,基本上它
浏览 5
提问于2020-01-29
得票数 2
2
回答
如
何在
没有30秒启动惩罚
的
情况下启动
spark
应用
程序
?
、
当做
spark
-submit需要30秒才能做任何事情时,我相信它绑定到sparkmaster上
的
一个端口,创建sparkcontext,分配执行器,jvm startup.etc我尝试使用local:/读取jar,这似乎可以节省几秒钟
的
时间
浏览 0
提问于2019-08-22
得票数 4
2
回答
为什么火星执行器
的
发射会出现延误?
、
当我试图优化一个火花工作时,我很难理解第二个和6-7s第三和第四执行者
的
发射
延迟
3-4秒。 这项工作分为三个阶段。正如所见,第二、第三和第四遗嘱执行人仅在第二阶段增加。 下面是第0阶段
的
快照。 随着第一阶段
的
结束。 如上图所示,执行
程序
2(与第一个工作人员相同)需要大约3s才能启动。执行者3和4(对第二个工人)花费
的<
浏览 0
提问于2020-01-26
得票数 1
2
回答
火花
调度
模式和应用队列有什么区别?
、
、
、
在测试多个作业同时运行或稍后提交
的
较小作业时火花作业
的
行为时。我在
spark
中遇到了两个设置。一种是可用
的
调度
模式,如下图所示:其中一个在
调度
程序
中,如下所示 我想了解两个设置和抢占之间
的
区别。我
的
要求是,在处理更大
的
工作时,在两者之间提交
的
小工作必须获得资源,而不需要等待更长时间。
浏览 2
提问于2016-08-10
得票数 1
回答已采纳
1
回答
如
何在
Spark
Streaming上下文中创建作业日志?
、
、
我目前正在对我
的
Spark
流媒体应用
程序
进行性能测试。总而言之,我通过套接字连接接收JSON消息,每秒一条消息。然后,我使用
Spark
Streaming方法将消息作为RDDs处理,最后将生成
的
RDDs打印到数据库。这是我
的
问题:每当我想要检查块处理时间或
调度
延迟
等时,我需要转到端口4040上
的
Spark
UI。 我想做
的
是在
程序
运行时使用这些值创建一个Log,并将其作为txt文件
浏览 0
提问于2016-05-06
得票数 1
2
回答
ftdi (vcp或d2xx)转发(从PC到ftdi设备)
延迟
、
如
FTDI网站上所述,要从FTDI设备接收字节到PC,由于此64字节USB数据包问题,可能会有
延迟
16ms (超时)+ 1ms (或更多,USB
调度
器时间)。如果我理解正确的话,在从FTDI芯片(FTDI_232或FTDI_245)到PC
的
连续数据流(没有流量
控制
)方面,(为了避免16ms超时
延迟
),最好
的
办法是要求: 如果USB
调度
器每1ms可靠
调度
驱动
程序
,则每1ms 62字节;如果USB
调度
器
浏览 3
提问于2014-11-14
得票数 1
2
回答
Apache与Apache作为大规模机器学习
的
平台?
、
、
谁能把Flink和
Spark
作为机器学习
的
平台进行比较呢?对于迭代算法,哪一种可能更好?链接到一般Flink与火花讨论:
浏览 3
提问于2015-04-21
得票数 27
回答已采纳
1
回答
春季网络流量: Schedulers.boundedElastic无限
增长
、
、
、
、
我正在用WebFlux监控我
的
Spring VisualVM应用
程序
,我注意到了一件奇怪
的
事情。 可能这个问题是因为我将ServerWebExchange作为
控制</em
浏览 13
提问于2022-07-04
得票数 1
回答已采纳
1
回答
RxJava。Observable.delay工作很奇怪(最后缺少一些项目)
、
我
的
测试代码是:import rx.Subscriber; import java.util.concurrent.TimeUnit文档显示,
延迟
只会发出源发出
的
可观察到
的
项,并通过指定
的
延迟
在时间上向前移动。
浏览 3
提问于2015-10-02
得票数 4
回答已采纳
1
回答
应用
程序
中
的
火花
调度
:性能问题
、
、
、
、
在这样
的
单个驱动
程序
实例中使用
调度
的
概念,可以监视多个星火应用
程序
。
调度
程序
在默认情况下配置为FIFO模式:更改
spark
.scheduler.listenerbus.event
浏览 2
提问于2020-03-01
得票数 5
回答已采纳
1
回答
如何限制星图操作?
我有一个S3 json数据集,它是KMS客户端加密DynamoDB
的
转储(即每条记录都是独立加密
的
KMS客户端)。我想知道是否有什么办法限制这些星图操作?
浏览 7
提问于2017-05-13
得票数 1
1
回答
csv文件与水槽与火花
的
集成
、
我有一个项目,就是将来自合作伙伴服务器
的
CSV文件集成到Hadoop集群中。我知道,当您需要执行数据转换时,
Spark
是首选。我
的
问题是,水槽和火花在集成逻辑上有什么区别? 在导入CSV文件时,它们之间是否存在性能差异?
浏览 0
提问于2018-10-02
得票数 1
回答已采纳
2
回答
如
何在
ASP.NET中使用Windows任务
调度
器
、
、
我试图在Window任务
调度
程序
中使用ASP.NET。我想在特定
的
时间发送电子邮件。但是ASP.NET不是作为EXE运行
的
,它有一个动态ip地址。我不知道在ASP.NET中使用Window任务
调度
程序
。您能给我提供一些解决方案吗?
浏览 2
提问于2017-05-25
得票数 0
回答已采纳
1
回答
找出内存泄漏时,瓦兰没有显示任何
、
、
我正在寻找一个在Linux上
的
C++
程序
中
的
内存泄漏,该
程序
具有很强
的
遗留背景(多线程,使用libstdc++容器)。这个
程序
是一个代理服务器,是从客户端到服务器
的
请求
的
中介。瓦兰已经检测到了一些现在已经修复
的
,并且没有显示更多
的
。 但是进程
的
RSS (
如
/proc//stat所示
的
驻留内存)仍然在给定
的
重复刺激(每
浏览 1
提问于2021-04-02
得票数 0
3
回答
Spark
如
何在
内部工作
我知道
Spark
可以使用Scala、Python和Java来操作。此外,RDDs还用于存储数据。 但是请解释一下,
Spark
的
架构是什么,它是如
何在
内部工作
的
。
浏览 0
提问于2015-06-07
得票数 38
1
回答
火花输出:日志式与进度式
、
两个不同
的
集群上
的
spark
-submit输出(都运行
Spark
1.2)看起来不同:一个是“日志样式”,即大量
的
消息流,
如
另一种“进度式”,即屏幕底部
的
一个
不断
增长</em
浏览 4
提问于2015-04-27
得票数 5
回答已采纳
2
回答
是否有可能同时读取HDFS数据并进行一些计算?
、
、
例如,我在星火平台上运行了以下工作计数应用
程序
:val counts = textFile.flatMap(line假设有一个工作人员需要处理1Gb数据,那么在获取所有1Gb数据之前,该工作人员是否有可能开始进行一些计算(
如
flatMap)?
浏览 3
提问于2016-04-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
再谈Spark Streaming Kafka反压
Spark的内存管理和调优机制
大数据技术,Spark详细介绍,Spark和Hadoop的区别
Hadoop生态圈初识
UC Berkeley提出新型分布式执行框架Ray:有望取代Spark
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券