腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2256)
视频
沙龙
1
回答
在
BigInsights
hadoop
群集
中
使用
spark-submit
提交
SparkR
作业
(
R
脚本
)
失败
、
、
、
、
我已经
使用
5个节点的
hadoop
集群(包括带有
SparkR
的Apache Spark )创建了IBM服务。我尝试
使用
SparkR
连接cloudant数据库,获取一些数据并进行一些处理。
在
BigInsights
hadoop
群集
中
使用
spark-submit
提交
SparkR
作业
(
R
脚本
)
失败
。我
浏览 11
提问于2016-08-08
得票数 1
1
回答
在
Rstudio
中
运行星火时找不到火花-cmd
、
、
我正在按照的指示
在
一台红帽子机上安装火花。我想在RStudio
使用
星火。我已经下载了spark-1.6.1-bin-
hadoop
2.6,并遵循了说明,并在RStudio
中
的
脚本
中放入了以下一行:Sys.setenv(SPARK_HOME"SPARK_HOME"), "
R
", "lib"), .libPaths())) # creat
浏览 5
提问于2016-06-23
得票数 0
回答已采纳
1
回答
Spark驱动程序未分配任何工作进程
、
我正在
使用
spark version 2.4.7-bin-
hadoop
.2.7java 8 具有1个主节点和2个工作节点的spark
群集
正在作为独立
群集
spark配置运行 spark.master${SPARK_HOME}/sbin/start-master.sh 从启动
脚本
为${SPARK_HOME}/sbin/start-slave.sh spark://localhost:7077 -c1 -m 50M 我想在
浏览 31
提问于2021-04-17
得票数 0
1
回答
SparkR
- ObjectStore:无法获取数据库global_temp,返回NoSuchObjectException
、
、
、
在
RStudio
中
尝试
使用
SparkR
连接到星火集群时: Sys.setenv(SPARK_HOME = "/usr/lib/spark/spark-2.1.1-bin-
hadoop
2.6") .libPaths(c(file.path(Sys.getenv("SPARK_HOME"), "
浏览 4
提问于2017-05-25
得票数 1
2
回答
星星之火-从外部AWS EMR集群
提交
、
、
、
我有一个AWS EMR集群运行火花,我想
提交
一个PySpark
作业
从我的笔记本电脑(-主纱),以集群模式运行。我知道我需要在笔记本电脑上设置一些配置,但我想知道最低配置是什么。或者我需要在本地机器上安装
hadoop
或纱线? 我已经搜索了相当多的答案,但我还不能确定我读到的内容是指从集群的主人或一些任意的笔记本电脑上启动一项工作……
浏览 0
提问于2018-06-07
得票数 1
回答已采纳
1
回答
SparkR
in RStudio:
sparkR
.session: JVM 10秒后还没有准备好
、
、
spark-submit
command--driver-memory "2g"中找到: C:\rtools40\usr\bin\make.exe“ 下载了最后一个预构建版本,并在c:\spark中
使用
所有者权限进行解压缩(文件夹名
中
没有空格!),为了安全起见,我已经将文件夹名
中
的所有标点符号替换为下划线_,正如您在上面的<
浏览 4
提问于2020-11-08
得票数 0
2
回答
使用
Livy执行Spark
作业
,
使用
`--master yarn-cluster`而不进行系统范围的更改
、
我想
使用
从集群外部通过HTTP调用来执行Spark
作业
,其中Spark jar已经存在于HDFS
中
。我可以从集群节点上的shell
中
spark-submit
该
作业
,例如:
spark-submit<
浏览 1
提问于2016-11-30
得票数 2
1
回答
hdfs:
在
sparkR
外壳程序
中
读取parquetfile时没有这样的文件或目录错误
、
、
、
、
我想从hdfs系统
中
读取
sparkR
shell
中
的parquetFile。所以我这样做: path<-"hdfs://year=2015/month=1/day=9"错误:No such file or directory
浏览 0
提问于2015-07-20
得票数 0
2
回答
SparkR
:从
R
数据帧收集数据不适用于RStudio
、
、
、
我尝试执行一个非常基本的火花操作(head())来收集我从
R
数据帧创建的火花DataFrame的输出。我想在yarn-client部署模式下这样做。我
在
集群的所有节点上安装了
R
。当我从RStudio运行此应用程序时:library(
SparkR
, lib.loc = c(file.path(Sys.getenv("SPARK_HOME"), "<em
浏览 0
提问于2016-01-21
得票数 0
2
回答
在
Windows环境下从Rstudio加载spark-csv
、
、
谁能告诉我,
在
Windows7环境下,是否可以
使用
R
studio从
SparkR
导入spark-csv包?我应该安装这个包(.jar文件)并放在某个文件夹
中
吗?下面是我的
脚本
:Sys.setenv(SPARK_HOME = 'C:/Users/***/spark-1.6.1-bin-
hadoop
2.6') Launching java with
浏览 2
提问于2016-04-22
得票数 1
1
回答
SparkR
作业
处理依赖项
、
、
、
如何处理依赖关系
在
(交互式)
sparkR
作业
的情况下?但是我需要一些外部包,例如连接到数据库(Mongo,Cassandra)或读取csv文件。
在
本地模
浏览 4
提问于2016-04-07
得票数 0
回答已采纳
1
回答
从ECS码头集装箱运行EMR
作业
、
我已经将用python编写的ML
作业
代码包含到一个码头容器
中
,并能够
使用
Amazon作为码头服务运行。我想
使用
星星之火以分布式方式运行,并在亚马逊EMR.Can上部署,建立ECS和EMR之间的连接?
浏览 3
提问于2017-05-25
得票数 9
回答已采纳
2
回答
如何在EMR
中
添加python火花步骤?
、
我
使用
了datapipeline定义,其中的步骤很简单,如下所示:现在,当我激活任务时,我会得到一个错误,类似于: 线程"main“
中
的异常:错误打开
作业
jar: /mnt/
浏览 7
提问于2016-06-21
得票数 2
1
回答
在
Spark应用程序
中
添加Yarn集群配置
、
、
、
我试图
在
scala应用程序中
使用
sbt,而不是直接
使用
spark-submit
。 val sc = new SparkConte
浏览 1
提问于2015-11-16
得票数 6
回答已采纳
1
回答
在
部署的集群上
使用
SparkR
访问Google存储
、
、
我已经
使用
bdutil一年了,与
hadoop
和火花,这是相当完美的!现在,我遇到了一个小问题,试图让
SparkR
作为HDFS与一起工作。下面是我的设置:- bdutil 1.2.1 -我已经部署了一个集群,其中包括一个主服务器和一个工作人员,安装了Spark1.3.0,
在
主服务器和工作人员上都安装了
R
和
SparkR
。当我
在
主节点上运行
SparkR
时,我试图
在
我的GS桶服务器上指向一个目录:> fi
浏览 1
提问于2015-05-27
得票数 2
回答已采纳
2
回答
无法启动--
在
s3桶上
提交
pyspark文件
、
、
、
、
我有一个pyspark代码,它既存储
在
AWS集群的主节点上,也存储
在
一个s3桶
中
,该桶从MySQL数据库
中
获取超过1.4亿行,并将列的总和存储
在
s3上的日志文件
中
。当我
在
主节点上
提交
电火花代码时,
作业
成功完成,输出存储
在
S3桶上的日志文件
中
。但是,当我
使用
这些-(
在
SSH-ing之后
在
终端上
使用
下面的命令向主节点
提交</
浏览 15
提问于2020-07-02
得票数 0
1
回答
如何通过scala代码获取
Hadoop
-spark
作业
的跟踪URL或捕获
spark-submit
输出
、
我部署
Hadoop
-Spark集群并运行我的
作业
。通过
提交
脚本
bin/ spark - submit,我可以成功
提交
spark
作业
。现在,我想像捕获一样捕获跟踪URL,并在我的其他scala项目中
使用
它。我该怎么做呢?我尝试重定向
spark-submit
输出,但它似乎不起作用,就像 .另外,我尝试
使用
scala.sys.process.ProcessIO来捕获
spark-submit
输出,它不起作用,因为我
浏览 1
提问于2015-11-05
得票数 2
1
回答
脚本
可以
在
shell
中
运行,但不能在Ruby
中
运行
、
、
我有一个
脚本
,填充多个火花
提交
作业
的参数。当我将它们复制并粘贴到shell
中
时,
作业
可以工作,但是当我将字符串放在反号
中
并从Ruby
中
执行它时,
作业
就
失败
了。
spark-submit
--master yarn-cluster \ --files ... \ -otherflagsRuby返回 sh: 1:
spark-sub
浏览 0
提问于2016-08-18
得票数 0
2
回答
无法
在
hadoop
中保存(拒绝用户权限)
、
、
我构建了一个星星之火应用程序来计算一个文件
中
的单词数。我
在
cloudera快速启动VM上运行应用程序,当我
使用
cloudera用户目录时一切正常,但是当我想在另一个用户目录
中
写入或读取时,就拒绝了
hadoop
的权限。我想知道如何改变
hadoop
用户的火花。import org.apache.spark.
浏览 0
提问于2014-12-11
得票数 3
回答已采纳
1
回答
如何设置和运行
SparkR
项目和
脚本
(如jar文件)?
、
、
我们已经成功地完成了关于
在
SparkR
实例上设置它并在RStudio
中
运行基本程序的所有EC2教程。我们现在无法弄清楚的是,如何创建一个带有
SparkR
作为依赖项的项目,编译/jar它,并在其中运行任何不同的
R
程序。 我们来自Scala和Java,因此我们可能以错误的心态来处理这个问题。这在
R
中
是可能的吗?或者Java的构建文件和jar所做的是不同的,还是您只需要单独运行每个
R
脚本
而不需要打包jar?
浏览 0
提问于2016-01-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Apache Spark 2.3 加入支持Native Kubernetes及新特性文档下载
Spark简史:从AMP lab到大数据王者
每天读一本:Spark快速大数据分析
大数据之spark基础知识
如何在CDH集群上部署Python3运行环境及运行Python作业
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券