前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >老弟手把手教你编译Spark3.2.1源码!!!!!

老弟手把手教你编译Spark3.2.1源码!!!!!

作者头像
刘浩的BigDataPath
发布2022-10-31 11:50:31
4130
发布2022-10-31 11:50:31
举报
文章被收录于专栏:大数据那些年

一年多没更新博客了,这一年博主经历了很多,也学到了很多,近期会持续更新文章,主题不固定,哦,对了,博主跟几个朋友一起创建了一个大数据的技术社区,我们每周都会有技术分享以及技术交流的会议,目前社区人数高达800+,感兴趣的朋友可以扫描上方的二维码关注下社区的公众号,同时也可以添加博主的VX,邀你进群咱们一起交流啊!!!!

1、官网下载 3.2.1版本 链接:Downloads | Apache Spark

2、将文件上传至服务器解压,并对其dev下 make-distribution.sh做配置

代码语言:javascript
复制
tar -zxvf spark-3.2.1.tgz
代码语言:javascript
复制
进入到 spark-3.2.1目录下的dev目录

3、对文件 make-distribution.sh 进行配置

代码语言:javascript
复制
vim make-distribution.sh
将版本信息注释掉
自己指定,如下

4、指定scala版本

代码语言:javascript
复制
[root@g7-8x-bigdata0 dev] ./change-scala-version.sh 2.12

5、进行编译

代码语言:javascript
复制
[root@g7-8x-bigdata0 dev]  ./dev/make-distribution.sh --name 3.2.1-hadoop3.2.1 --tgz -Phive -Phive-thriftserver -Pyarn -Dhadoop.version=3.2.1 -Dscala.version=2.12.15

注意:命令中对应兼容的hadoop和scala版本号一定要写对哇!

6、编译成功

代码语言:javascript
复制
出现success即可
代码语言:javascript
复制
编译完以后进入到目录下可以看到编译好的jar包

7、编译遇到的问题

代码语言:javascript
复制
1)编译所需依赖包下载慢
exec: curl --silent --show-error -L https://downloads.lightbend.com/scala/。。。。

解决办法:
在linux 配置 maven,并且maven镜像要使用阿里云镜像,
并在 spark家目录下dev下文件make-distribution.sh如下处 
指定maven路径,如下:
代码语言:javascript
复制
2)编译时提示内存不足

Java HotSpot(TM) 64-Bit Server VM warning: CodeCache is full. Compiler has been disabled
解决办法:
指定的maven内存—调大
在配置的环境变量中加入:
export MAVEN_OPTS="-Xms1024m -Xmx1024m -Xss1m"


然后source  /etc/profile !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-10-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档