腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(231)
视频
沙龙
1
回答
JSON4S
是否
与
spark
2.4.0
和
EMR
5.26.0
兼容
、
、
、
Spark
json4s
[java.lang.NoSuchMethodError: org.json4s.jackson.JsonMethods$.parse(Lorg/
json4s
/Js] 在aws
emr
上运行
spark
scala结构化流应用程序时,解析复杂json时出现上述错误。
浏览 17
提问于2019-08-26
得票数 2
1
回答
火花org.json4s.jackson.JsonMethods$.parse(Lorg/
json4s
/Js]
json4s
[java.lang.NoSuchMethodError: java.lang.NoSuchMethodError
、
队员们,
Spark
json4s
[java.lang.NoSuchMethodError: 然而,Parse方法使用的是
spark
2.3.x版本。
浏览 0
提问于2019-08-26
得票数 1
2
回答
EMR
总是给我Scala应用程序找不到的类
、
、
、
嗨,我想测试
EMR
的自定义步骤功能。 └───test └───samples 在使用mvn package构建包之后,我将其提交给
emr
浏览 0
提问于2019-05-13
得票数 1
回答已采纳
4
回答
由于AbstractMethodError,
spark
scala avro写入失败
、
代码: val df =
spark
.read.format("avro").load("s3://test-bucekt/source.avrodf.write.partitionBy("partitioning_column").format("avro").save("s3://test-bucket/processed/proces
浏览 40
提问于2019-11-27
得票数 0
2
回答
AWS
EMR
5.20
和
Java版本支持
、
、
我想知道AmazonEMR5.20AMI
是否
支持Java 9? 谢谢。
浏览 0
提问于2019-01-02
得票数 6
回答已采纳
2
回答
AWS Glue上的Delta湖-集群崩溃
、
、
检查驱动程序日志中
是否
有警告消息. 很明显,我所有的执行者都死了,但由于某种原因,aws胶水的工作还在继续,这让我感到不快。决定通过设置监视选项来重现错误:作业度量
和
连续日志记录,以及将超时限制设置为60分钟。作为最后一个实验,我在EC2 16 on内存上运行了一个类似的脚本,在本地模式下运行了一个带有自定义配置的
Spark
脚本,并且我的脚本完成了,没有任何问题!这表明问题不在于计算资源。
浏览 11
提问于2021-12-11
得票数 1
3
回答
方法isBarrier([])不存在
、
、
当我在命令行中直接启动吡火花会话并输入相同的代码时,它工作得很好:我的设置: [消]电火花
2.4.0
浏览 0
提问于2019-03-04
得票数 7
回答已采纳
2
回答
Apache火花
和
Java错误-引起: java.lang.StringIndexOutOfBoundsException:开始0,结束3,长度2
、
、
、
我尝试使用
spark
和
java创建一个示例应用程序。\curator-recipes-
2.4.0
.jar;C:\Users\amanaf\.m2\repository\org\apache\curator\curator-framework\
2.4.0
\curator-framework-
2.4.0
.jar;C:\Users\amanaf\.m2\repository\org\apache\curator\curator-client\
2.4.0
\curator-client\json4
浏览 0
提问于2018-11-29
得票数 5
回答已采纳
1
回答
在将
Spark
应用程序部署到
EMR
6.x时,应该包括哪些依赖项?
、
、
、
文档还指向应该使用的独立的
兼容
Maven的存储库:,我不确定
是否
应该像这样添加它(
与
Maven Central一起): maven {}aws
emr
create-cluster --auto-scaling-role myprod-
emr
-auto-scaling --app
浏览 2
提问于2021-07-13
得票数 5
1
回答
使用geospark库时使用Maven包错误
、
、
、
、
目前,我正在研究地理空间分析用例,我正在使用
spark
2.4.0
和
geospark library.When一起使用eclipse创建应用程序jar文件--它给了我下面的error.Could,请帮助我解决下面的</groupId> <version>
2.4.0
</version> </dependenc
浏览 2
提问于2020-03-24
得票数 0
回答已采纳
3
回答
Scala/
Spark
版本
兼容
性
、
我正在构建我的第一个
spark
应用程序。所以我的问题是:
Spark
网站上的2.11到底是什么意思。它有没有在2.11.0 - 2.11.11范围内的Scala版本?另一个问题:我可以使用最新的Scala 2.12.2构建我的
Spark
应用吗?我假设Scala是向后
兼容
的,所以使用Scala构建的
Spark
库可以在Scala 2.12.1应用程序中使用/调用
浏览 5
提问于2017-05-10
得票数 12
2
回答
在
emr
5.29.0上运行scala 2.12
、
、
、
我有一个用Scala2.12编译的jar文件,现在我想在
emr
5.29.0上运行它。如何运行它们,因为
emr
5.29.0的默认版本是scala 2.11。
浏览 0
提问于2020-02-26
得票数 8
1
回答
Spark
预培训管道
是否
只适用于linux系统?
我正在尝试设置一个简单的代码,在其中传递一个数据,并使用johnSnowLabs
Spark
库提供的经过预先训练的解释管道来测试它。com.johnsnowlabs.nlp.SparkNLP .config("
浏览 0
提问于2019-08-22
得票数 8
回答已采纳
2
回答
在没有
EMR
的AWS上运行HDFS集群
、
、
、
、
有一种解决方案说,我可以将数据保存在S3存储桶中,并在每次启动
EMR
集群时加载它。然而,这是重复的,特别是如果数据很大的话,就会产生巨大的开销。我想知道在AWS中
是否
有类似的方法。
浏览 3
提问于2020-05-04
得票数 1
回答已采纳
1
回答
无法将电子病历中的Cassandra
与
群集模式下的bundle.zip连接
、
、
、
我正在尝试连接AWS
EMR
中的Astra Cassandra。但是Executor无法获得包文件,因为我正在通过S3传递该文件。 这是我传递的
spark
提交命令。--master yarn--packages com.datastax.
spark
:
spark
-cassandra-connector_2.12:3.1.0,org.apache.hadoop:hadoop-aws:3.1.2 --conf
spark
.files=s3://.
浏览 9
提问于2021-08-28
得票数 3
1
回答
带有Apache Flink 1.5的Apache Bean
2.4.0
、
有没有一个地方我们可以快速参考
和
查看Apache beam
和
运行时环境(Flink,
Spark
等)之间的版本
兼容
性。我正在以一种艰难的方式学习它:我不确定我的问题有多少是由版本错误造成的。目前我使用的是光束
2.4.0
,看看flink runner pom (),它使用的是flink 1.4.0 jars。所以我假设Apache beam
2.4.0
可以
与
Apache Flink 1.4.0一起工作。这是正确的解释吗? 不幸的是,Flink 1.4.0 ()没有官方的do
浏览 0
提问于2018-06-14
得票数 0
1
回答
是否
可以使用Hadoop3.x
和
Hive3.x使用火花2.4?
、
、
、
、
我们使用
spark
2.4.0
连接到Hadoop2.7集群,并从2.3版本进行查询。但是集群管理团队已经决定升级到Hadoop3.x
和
Hive3.x。我们还不能迁移到
spark
3,这与Hadoop 3
和
Hive 3
兼容
,因为我们无法测试
是否
有任何故障。
是否
有可能继续使用2.4.x版本,并且仍然能够使用Hadoop 3
和
Hive 3?
浏览 8
提问于2020-07-06
得票数 2
1
回答
AWS管理自动标度吗?
、
、
、
我正在使用Sagemaker进行预处理
和
生成培训数据,我遵循的是文档,但我目前看不到如何在
EMR
集群中指定自动标度。下面是我的代码;它非常“正在进行中的工作”,但我想知道
是否
有人可以为我提供或指向一个显示以下资源的资源: ) 对于这些类型的任务,我习惯于通过Py
浏览 3
提问于2021-04-01
得票数 0
1
回答
SparkSession应用程序源代码Config属性在AWS默认情况下不覆盖JupyterHub & Zeppelin
、
、
、
、
我有星火驱动程序设置使用Zeppelin
和
或JupyterHub作为客户端进行AWS
EMR
上的交互式火花编程。但是,当我创建具有自定义配置属性(应用程序名称、内核#、executor ram、# of executor、序列化程序等)的SparkSession时,它不会覆盖这些信任的默认值(在
Spark
UI
和
与
任何
Spark
一样,
EMR
上的这些客户端应该使用我的自定义配置属性,因为SparkSession代码是火花提交、火花配置文件
和
火花默认值之前
浏览 0
提问于2019-08-15
得票数 0
1
回答
使用j观察者在
Spark
上同时运行批处理
和
实时作业
、
由于批处理作业已经在
spark
中编写,所以我寻找了一种方法来实现这个目标,并在我的
spark
集群中遇到了Sparkj观察者,它在这里可能会有所帮助。我的问题: 我
是否
可以使用同一个
与
j观察者
兼容
的JAR来运行AWS
EMR
上的火花作业?
浏览 3
提问于2021-05-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 开启动态资源分配
EMR 实战心得浅谈
Apache Spark 3.0新特性在FreeWheel核心业务数据团队的应用与实战
AWS EMR在搭建大数据平台ETL中的应用实践
pyspark 安装
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券