腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何将注册为
spark
表的表放入数据帧
、
、
、
我已经使用
spark
-thriftserver connection将表从PostgreSQL数据库导入到
spark
-sql中,现在我可以从直线上看到这些表。有没有办法把这些表格转换成
spark
数据帧?
浏览 1
提问于2016-09-25
得票数 2
2
回答
Spark
ML和MLLIB包之间的区别是什么
、
、
我注意到SparkML中有两个LinearRegressionModel类,一个在ML包(
spark
.ml)中,另一个在MLLib (
spark
.mllib)包中。
浏览 9
提问于2016-08-09
得票数 50
回答已采纳
1
回答
在
spark
集群中配置主节点
我已经在独立模式下创建了一个包含4个worker的
spark
集群,在成功配置worker属性之后,我想知道如何配置master属性。我正在编写一个应用程序,并使用SparkSession.builder将其连接到集群(我不想使用
spark
- submit提交它)。我知道工作进程可以在conf/
spark
-env.sh文件中配置,并且具有可以设置的参数,例如'
SPARK
_WORKER_MEMORY‘和'
SPARK
_WORKER_CORES’ 我的问题是:如何配置主服务器的属性因
浏览 10
提问于2017-07-26
得票数 1
回答已采纳
1
回答
如何在同一
spark
上下文中运行多个按需作业
、
我想在相同的
spark
上下文中按需运行不同的作业,但我不知道如何才能做到这一点。我在Amazon EMR上运行代码,使用yarn作为资源管理器。=true \ --conf
spark
.dynamicAllocation.minExecuto
浏览 2
提问于2017-02-06
得票数 1
2
回答
用kotlin
编程
ApacheSpark2.0
、
、
我想在
Spark
2.0中使用kotlin进行
编程
。在
Spark
2.0中是否可以使用Kotlin进行
编程
?如果是的话,我该怎么做?
浏览 1
提问于2019-01-29
得票数 4
回答已采纳
1
回答
Spark
- tsv文件读取为空
、
、
、
我有一个使用"\t“作为分隔符的.csv文件,我尝试将其读取为:一些标题列名称以及数据值确实包含空格,但从不包含制表符。此文件的标头被正确读取到DF的标头中,但没有数据被读取到DataFrame中。我做错了什么?
浏览 2
提问于2020-01-08
得票数 0
1
回答
AttributeError: SQLContext实例没有属性“createDataFrame”
、
、
、
文件"/****/***/
spark
-1.1.0/examples/src/main/python/testSql.py",第25行,在schemaEvents = sqlContext.createDataFramefrom pyspark.sql import * #File = "/home/shafee/
spark
-1.1.0/results-201603
浏览 1
提问于2016-03-15
得票数 0
1
回答
在PYspark中创建RDD
Spark
中的一切都是以RDD (键和值对)的形式创建的。这有必要吗?可以通过RDD数据集创建/执行哪种类型的分析?请提供一个将其转换为RDD的示例和用法 谢谢,Aditya
浏览 15
提问于2019-04-30
得票数 0
1
回答
为什么
Spark
(PySpark或Scala)运行在客户端模式而不是集群模式?
、
、
、
、
我一直理解
Spark
,无论是PySpark还是Scala,都是在客户端模式下运行的。如果我错了,在集群模式下没有开箱即用的配置。Error: Cluster deploy mode is not applicable to
Spark
shells.
浏览 1
提问于2019-07-05
得票数 1
1
回答
为不同的并行度运行
Spark
作业
、
我想要比较不同并行度的
Spark
作业的运行时间,以便分析是否添加更多的并行度更快。问题是,当我创建
Spark
会话时,我认为我可以通过更改以下内容来实现: .master(master) .config(conf) .config("
spark
.default.parallelism", number_of_partitions) // th
浏览 34
提问于2021-05-15
得票数 0
回答已采纳
3
回答
如何获取当前SparkContext的jobId?
、
、
所有其他问题似乎都解决了
Spark
applicationId的获取问题。我想以
编程
方式取消需要jobId的
spark
作业。
spark
.sparkContext.cancelJob(jobId)
浏览 55
提问于2021-11-12
得票数 0
1
回答
Spark
优雅地停止并退出(1)
我以<code>D0</code>模式运行
spark
应用程序。<code>A1</code><code>A2</code>
Spark
应用程序已在重试配置文件中重试。问题 我怎样才能优雅地停止
spark
,然后在应用程序中以
编程
方式退
浏览 25
提问于2020-07-31
得票数 0
1
回答
Apache
Spark
上的Java应用程序
、
有人能告诉我是否有任何Java应用程序可以部署在Apache或任何条件上(代码修改,.)必须考虑到吗?
浏览 4
提问于2016-03-09
得票数 0
回答已采纳
1
回答
Vora
Spark
shell语法
、
在Scala
Spark
语法上,用于Vora的
Spark
shell中是否存在
编程
上的差异。我需要确保我可以使用广泛可用的
Spark
示例。谢谢。
浏览 0
提问于2015-11-17
得票数 0
1
回答
Cassandra数据库中数据分析的备选方案
、
、
、
没有显示报告的
spark
界面。 导致维修费用高的要求 2)将数据移至红移,并在此基础上进行分析。
浏览 2
提问于2016-06-20
得票数 2
2
回答
无法修改星图配置的值:
spark
.executor.instances
、
、
我正在使用
Spark
3.0并设置参数
spark
.conf.set("fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem")
spark
.conf.set("
spark
.sql.files.maxPartitionBytes"
浏览 11
提问于2022-06-17
得票数 2
回答已采纳
1
回答
如何在
Spark
中生成整型的GUID列
、
、
、
我如何在
Spark
中做到这一点?我知道
Spark
有monotonically_increasing_id(),但这只适用于
Spark
应用
编程
接口--那么对于数据集呢?
浏览 0
提问于2017-10-19
得票数 2
3
回答
在Apache
Spark
中提交申请
、
我是Apache
Spark
的新手,正在尝试创建一个简单的应用程序来在本地模式下运行它,我意识到它有像
spark
-submit这样的脚本来提交应用程序。我正在寻找类似于Apache Storm的LocalCluster.submitTopology()以
编程
方式提交应用程序。请告诉我在
Spark
中对应的API。感谢在这方面的帮助。谢谢。
浏览 3
提问于2016-09-20
得票数 1
1
回答
使用独立的本地
spark
java程序读取GCS文件
、
、
、
、
我正在尝试使用java中的本地独立
spark
作业读取存储在GCS存储桶上的文件。我已经为SparkContext配置了所有必要的
spark
配置。Option.scala:120) at org.apache.
spark
.rdd.MapPartitionsRDD.getPartitions(Option.scala:120) at org.apache.
spark
.rdd.RD
浏览 0
提问于2017-10-10
得票数 1
1
回答
如何将DSX笔记本电脑迁移到
Spark
2.0?
它目前与
Spark
1.6捆绑在一起,但我想使用SparkSession,以及
Spark
中的其他新功能。如何才能在不将每个计算单元复制到新notebooK的情况下进行迁移?
浏览 2
提问于2017-03-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark实战(5)_Spark Core核心编程
Spark快速入门-2-Spark的编程模型
Spark支持哪些编程语言?
Spark 核心编程RDD 行动算子
Spark SQL,DataFrames 以及 Datasets 编程指南
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券