Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Apache火花相关只运行在驱动程序上。

Apache火花相关只运行在驱动程序上。
EN

Stack Overflow用户
提问于 2017-06-29 05:59:37
回答 1查看 395关注 0票数 0

我对火花还不熟悉,并了解到转换发生在工人身上,而操作发生在驱动程序上,但是中间动作(如果操作是可交换的和结合的)也可以发生在工人身上,这给出了实际的并行性。

我查看了相关和协方差代码:https://github.com/apache/spark/blob/master/mllib/src/main/scala/org/apache/spark/mllib/stat/correlation/PearsonCorrelation.scala

https://github.com/apache/spark/blob/master/mllib/src/main/scala/org/apache/spark/mllib/linalg/distributed/RowMatrix.scala

我如何才能找到相关的哪一部分发生在驱动程序和什么在执行者?

更新1:我所说的运行关联的设置是由多个VM组成的集群设置。

更新2

我将集群设置为独立模式,就好像它是一个3节点集群、1个主/驱动程序(实际机器:工作站)和2个VM从/执行器一样。从主节点提交类似于这个./bin/spark-submit --master spark://192.168.0.11:7077 examples/src/main/python/mllib/correlations_example.py的作业

我的相关示例文件是correlations_example.py:

代码语言:javascript
运行
AI代码解释
复制
data = sc.parallelize(np.array([range(10000000), range(10000000, 20000000),range(20000000, 30000000)]).transpose()) 
print(Statistics.corr(data, method="pearson")) 
sc.stop()

我总是得到一个连续的时间线,因为:

这不意味着根据事件的时间线,它不是并行发生的吗?我是不是做错了工作提交或相关计算在星火不是平行的?

更新3:我甚至尝试添加另一个执行器,仍然是相同的seqquential treeAggreagate。我设置了火花集群,如这里所提到的:http://paxcel.net/blog/how-to-setup-apache-spark-standalone-cluster-on-multiple-machine/

EN

回答 1

Stack Overflow用户

发布于 2017-06-29 06:15:36

你的说法不完全准确。驱动程序的容器执行器在客户端/边缘节点或集群上启动,具体取决于火花提交模式(例如客户端或纱线)。操作由工人执行,结果被发回给司机(例如,收集)

这个问题已经得到了答复。有关详细信息,请参阅下面的链接。When does an action not run on the driver in Apache Spark?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44827282

复制
相关文章
耳机驱动程序上报
上报设备 headset :听筒mic headphone:听筒没有mic Lineout:声音输出没有mic 上报方式 输入子系统: 可上报输入事件 上报开关事件 switch state:uevent 编写输入系统驱动 分配input_dev; 设置: 能产生哪类事件:EV_SW 能产生EV_SW中的哪些事件 headset headphone Lineout 注册input_dev 硬件相关(中断程序) 上报插入事件 上报拔出事件 #include <linux/module.h> #incl
233333
2018/10/09
1.6K0
耳机驱动程序上报
运维相关
服务器配置: 数据库rds、redis、nacos、nginx、node、git、域名、OSS、java、maven 安装Java\maven\nginx\Mysal JAVA yum install java-1.8.0-openjdk : java -version vim /etc/profile.d/java.sh JAVA_HOME=“/usr/lib/jvm/java-1.8.0-openjdk” source /etc/profile.d/java.sh 验证:echo $JA
六个周
2022/10/28
2.8K0
运维相关
【程序源代码】可以运行在小程序上的图表工程
可以运行在小程序上的图表工程;可以跨端使用,支持 H5、小程序(微信/支付宝/百度/头条/QQ/360)、APP,调用简单方便、性能及体验极佳。虽然没有 Echarts 及 F2 图表功能强大,但可以实现一套业务逻辑各端通用,并解决了支付宝小程序图表显示模糊等问题。支持单页面多图表,demo 中单页 10 个图表,响应速度超快。支持入场动画及 ToolTip 动画效果。独特支持 横屏模式。
程序源代码
2020/12/14
5030
rabbitMQ 运维相关
相对前面几个章节来说,这个章节知识点不是着重点。大家对这一章节知识的掌握程度为了解。好了,废话不多说,开始正文
六个核弹
2022/12/23
4420
Linux系统驱动之层级中断控制器驱动程序上机实验
看上图,选择122号中断,它是SPI里的122号中断,GIC里的编号是(32+122)=154。
韦东山
2021/12/08
1.1K0
Linux系统驱动之层级中断控制器驱动程序上机实验
如何使用Apache驱动Django
Django是一个功能强大的Web框架,可以帮助您快速启动Python应用程序或网站。Django包含一个简化的开发服务器,用于在本地测试您的代码。但是其也需要一个更安全,更强大的Web服务器来处理任何关于生产细节的问题。
葡萄
2018/07/16
4.2K1
Apache常用配置-运维笔记
===========================.htaccess文件配置笔记=========================== .htaccess文件是Apache服务器中的一个配置文件,它负责相关目录下的网页配置。通过对.htaccess文件进行设置,可以帮我们实现:网页301重定向、自定义400/403/404/500错误页面、改变文件扩展名、允许/阻止指定IP用户访问、禁止目录列表、配置默认文档等功能,可以说是功能非常强大。
洗尽了浮华
2018/10/22
2.7K0
Apache ZooKeeper - FourLetterCommands运维命令
除了 JConsole 监控控制台之外,ZooKeeper 还提供了一些命令,可使我们更加灵活地统计监控 ZooKeeper 服务的状态信息。
小小工匠
2021/08/17
3970
数据驱动框架(Apache POI – Excel)
自动化测试框架是用于创建和设计测试用例的一组准则或规则。该准则包括编码标准,对象存储库,测试数据处理方法,存储测试结果的过程或有关如何访问外部资源的任何其他信息。
用户8460142
2023/07/07
3050
数据驱动框架(Apache POI – Excel)
Python运维相关模块汇总
psutil是一个跨平台库(http://code.google.com/p/psutil/),能够轻松实现获取系统运行的进程和系统利用率(包括CPU、内存、磁盘、网络等)信息。它主要应用于系统监控,分析和限制系统资源及进程的管理。它实现了同等命令行工具提供的功能,如ps、top、lsof、netstat、ifconfig、who、df、kill、free、nice、ionice、iostat、iotop、uptime、pidof、tty、taskset、pmap等。
三杯水Plus
2021/03/08
8750
Python运维相关模块汇总
psutil是一个跨平台库(http://code.google.com/p/psutil/),能够轻松实现获取系统运行的进程和系统利用率(包括CPU、内存、磁盘、网络等)信息。它主要应用于系统监控,分析和限制系统资源及进程的管理。它实现了同等命令行工具提供的功能,如ps、top、lsof、netstat、ifconfig、who、df、kill、free、nice、ionice、iostat、iotop、uptime、pidof、tty、taskset、pmap等。
zd123
2021/03/09
1K0
面试驱动技术 - Category 相关考点
使用 xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc MNPerson+Test.m 函数,生产一个cpp文件,窥探其底层结构(编译状态)
小蠢驴打代码
2019/03/11
6740
面试驱动技术 - Category 相关考点
硬件笔记只AMD显卡更新驱动重启黑屏
最近RX588更新驱动,选了清洁模式(删除所有用户设置),按要求重启后电脑直接黑屏了,连bios启动图片都没见到; 百度查了一圈,很多朋友都是这个问题,看来amd驱动真是名不虚传
Jetpropelledsnake21
2020/05/27
2.1K0
关于数据驱动运维的几点认识
在一个新的环境中工作了两个多月,从业务模式、平台建设、工作方法和团队工作风格各个方面都有了一些认识。有了这些认识,更能让你体会到工作的发力点在哪里,这次自己的工作方法做了很大的调整,没有去平移过去的工作经验,因为当前的很多预设条件和过去不同(具体就不一一列举)。其实运维工作很多时候都聚焦在两个方面,一个是工具建设;一个是数据建设。在工具平台建设层面上,进一步突破的阻力很大,一则缺乏标准化的基础;其次还在于大家意识的改变。因此这次想从数据分析体系入手,用数据说话,用数据评价运维服务。简而言之,就是数据驱动运维(Data-Driven Ops)。
用户1593318
2019/11/18
1.1K0
CMDB: 流程规范加持+运维场景驱动
关于CMDB使用过程中的一次总结,通过CMDB的认识、进化、流程规范支撑、运维场景驱动等方面的介绍,让我们快速了解
iginkgo18
2023/07/21
1.5K0
Apache Ranger:运维管理的神兵利器
Ranger的中文释义是“园林管理员”。正如其名,Apache Ranger很好的承担了Hadoop这个大园林的管理员职责。Ranger提供了一个集中式的安全管理框架,用户可以通过操作Ranger控制台来配置各种策略,从而实现对Hadoop生态组件如HDFS、Hive、HBase、Yarn等进行细粒度的数据访问控制。
子润先生
2021/06/18
2K0
数据驱动、精细闭环的运维服务
游戏业务运维工作很容易由于各项事务繁杂,陷入到只关心手头上的工作,“云梯”服务化主要是让运维能更好站在业务和玩家的角度来思考支撑工作如何更好服务于业务。通过数据来体现服务质量,并通过流程驱动闭环的形成,不断的提升运维服务质量。 “云梯”服务化涉及范围较多,如版本服务、活动服务、登录服务、下载服务、成本服务等。在上面的故障处理、大版本等章节中,已经介绍了版本服务、活动服务、下载服务等,所以这里只挑取登陆服务在QQ炫舞和DNF的应用简单介绍。 QQ炫舞做的登陆服务中,通过采集登录系统以及游戏内日志,发现每天约十
腾讯大讲堂
2018/02/11
8090
数据驱动、精细闭环的运维服务
Apache IoTDB 系列教程-3:部署运维
IoTDB 的理念就是系统运维要简单,要一键启动、开箱即用。就从启动开始说起吧,需要安装 jdk8 或者 jdk11,下载发布版,http://iotdb.apache.org/Download/ ,解压缩后是这样的目录结构:
Apache IoTDB
2020/09/27
1.8K0
Apache IoTDB 系列教程-3:部署运维
GPT-4只是AGI的火花?LLM终将退场,世界模型才是未来
在人类的认知之中,似乎早已习惯将通用人工智能(AGI)设定为人工智能的终极形态和发展的最终目标。
新智元
2023/09/09
3440
GPT-4只是AGI的火花?LLM终将退场,世界模型才是未来
运维相关指标数据采集并ES入仓 - 运维笔记
为了进行数字化IT治理,需要对一些应用进程相关指标进行采集并入库。收集到的应用指标数据最好要进行ES入仓,入到Kafka里面,并通过Kibana可视化展示。
洗尽了浮华
2019/07/08
1.5K0

相似问题

Apache火花-计算相关性

13

Apache火花和域驱动设计

10

Apache火花驱动程序内存

41

火花-在驱动程序上执行MLlib computeSVD

15

火花驱动程序上的并行文件操作

112
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文