腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
运行
spark
应用程序
将
数据
移
动到
java.util.NoSuchElementException
时
,
None.get
的
修复
方法
是什么
?
apache-spark
、
apache-spark-sql
、
greenplum
我正在尝试使用greenplum
spark
连接器jar: greenplum-
spark
_2.11-1.3.0.jar
将
数据
从GP移
动到
Hive。" = 12 AND "source_system_name" = 'BANKERS' AND "period_year" = 2017) AND (gp_segment_id = 48) 但是作业
运行
了一段时间,没有任何适当
的
结果/进度,它以
浏览 67
提问于2019-02-05
得票数 0
1
回答
星星之火:
将
大型MySQL表读入DataFrame失败
mysql
、
apache-spark
因此,请放心,
在
经过几天(失败
的
)解决方案搜索之后,我
将
发布这个问题。我试图编写一个作业,
将
数据
(每天一次)从MySQL表移
动到
存储
在
Amazon S3上
的
Parquet / ORC文件
的
Hive表中。目前,我们正在为此使用sqoop,但出于以下原因,我们希望迁移到
Spark
: 为了利用DataFrame API
的
功能(将来,我们将在移动
数据
时
执行转
浏览 1
提问于2018-03-07
得票数 7
2
回答
火花出口例外
scala
、
apache-spark
、
apache-spark-sql
这是我在
运行
应用程序
时获得
的
stackTrace:链接到代码是: 在线显示打印,上
的
显示
将
抛出此异常。服务器配置:我
在
具有10 gb内存
的
8核
浏览 3
提问于2016-11-03
得票数 2
回答已采纳
1
回答
在
流模式下打印
数据
帧
时
,输出为空。
file
、
spark-streaming
、
spark-dataframe
我有一个文件夹,它用不同
的
txt文件以流式方式填充。我编写了一个代码,提取一些IP信息,然后将它们放在一个
数据
帧中。(如果我
在
非流式模式下使用它,它会很好)问题是,当我执行我
的
代码
时
,所有输出都是空
的
!这是我
的
代码:import org.apache.
spark
.mllib.regression.StreamingLinearRegressio
浏览 1
提问于2017-05-29
得票数 1
3
回答
HDFS中
的
数据
节点是否与
spark
集群中
的
executor节点相同?
apache-spark
、
hadoop
、
mapreduce
、
hdfs
我正在学习Apache
Spark
和HDFS。尽管我对一件事感到困惑,但我对这两种语言大体上都理解。我
的
问题是: HDFS中
的
数据
节点是否与
spark
集群中
的
executor节点相同?换句话说,HDFS中
的
节点是对其包含
的
数据
进行操作,还是将来自HDFS中
的
数据
节点
的
数据
发送到
spark
集群中
的
executors节点,
在
浏览 1
提问于2019-05-21
得票数 0
4
回答
当Android
应用程序
关闭或失去焦点
时
,如何调用该
方法
?
java
、
android
、
sqlite
、
security
、
ondestroy
因为我正在构建
的
应用程序
将
处理相当敏感
的
数据
,所以我想在用户每次登录
时
将
SQLite db与服务器同步,并在
应用程序
失去焦点
时
删除
数据
库(因为用户移
动到
主屏幕或其他
应用程序
)。为了测试所描述
的
生命周期,我只需覆盖所有生命周期
方法
(onCreate、onStart、onResume、onPause、onStop和onDestroy),
在</
浏览 5
提问于2013-10-24
得票数 4
回答已采纳
2
回答
如何对大型
数据
集使用COGROUP
scala
、
apache-spark
、
apache-spark-sql
我有两个rdd's,即val tab_a: RDD[(String, String)]和val tab_b: RDD[(String, String)],我对以下
数据
集使用了cogroup: { }对于映射函数,我使用tab_c代码分组值,对于小型
数据
集,它可以很好地工作,但是对于巨大
的
数据
集,它会抛出Out Of Memo
浏览 3
提问于2017-11-08
得票数 1
回答已采纳
1
回答
用于处理保存在HDFS中
的
小型二进制文件
的
Spark
架构
hadoop
、
apache-spark
、
hbase
、
hdfs
、
apache-kafka
上传完成后,web
应用程序
将此文件和目录放入HDFS,然后
在
kafka上发送带有此文件路径
的
消息。
Spark
应用程序
从kafka streaming读取消息,
在
master(驱动程序)上收集它们,然后处理它们。我首先收集消息,因为我需要将代码移
动到
数据
,而不是
将
数据
移
动到
接收消息
的
位置。我对kafka有问题,因为我被迫首先收集它们出于上述原因,当我想创建检查点
应用程序</e
浏览 0
提问于2017-01-05
得票数 1
1
回答
火花流待批处理
apache-spark
、
apache-kafka
、
spark-streaming
我正在
运行
一个
Spark
Streaming
应用程序
,它从Kafka (使用Direct Stream
方法
)读取
数据
,并将结果发布回Kafka。该
应用程序
的
输入速率以及
应用程序
的
吞吐量
在
大约一两个小时内保持稳定。之后,我开始看到
在
Active Batches队列中保留很长时间(对于30mins+)
的
批处理。
Spark
driver日志指示以下两种类型
的</
浏览 3
提问于2017-08-04
得票数 0
2
回答
如何处理timeseries
数据
库中
的
测量误差?
errors
、
data-cleansing
我有一张表,用来记录在不同传感器上定期采样
的
测量
数据
。每行记录时间、所测量数量
的
标识符以及值本身。完全删除违规行,丢失错误信息;用NULL替换值,丢失原来
的
错误值吗? 还是我没有考虑过
的
另一种选择?
浏览 0
提问于2015-06-01
得票数 2
回答已采纳
1
回答
将
Spark
1.3升级为
Spark
1.4-蜂巢上下文问题
java
、
apache-spark
、
hive
我正在尝试使用
Spark
1.3
将
Java
应用程序
升级到使用
Spark
1.4。我们以前允许使用多个Hive
数据
库/上下文,
方法
是让查询类似于:但是现在,当我从
Spark
执行这样
的
查询
时
,我会看到一个错误: org.apache.
spark
.sql.AnalysisException: no such table default.table_n
浏览 1
提问于2015-07-30
得票数 0
回答已采纳
2
回答
Outlook 2007无限文件夹嵌套
exchange-2007
、
outlook-2007
、
outlook-web-app
、
directory
我们
的
exchange中有一个用户
将
收件箱
的
一个子文件夹移
动到
该子文件夹下,现在已经创建了一个无限嵌套
的
文件夹循环(请参阅屏幕快照)。📷 这在Outlook 2007和OWA中都很流行,因此它似乎是一个问题服务器端,但是我想不出
是什么
导致了它,更不用说如何解决问题了。我尝试创建文件夹
的
副本,然后
将
副本
移
回原始文件夹结构
的
副本,但是当我这样做
时
,2个循环文件夹随后是空
的
(
在<
浏览 0
提问于2011-09-15
得票数 7
1
回答
将死信消息
移
回处理主题
的
最简单
方法
?
c#
、
apache-kafka
当消息无法处理
时
,我们
将
消息放在死信主题上。我们现在有数百条关于死信主题
的
消息,这些消息是由于我们
应用程序
中
的
一个bug而被放在那里
的
。既然我们已经
修复
了引起bug
的
问题,那么
将
所有消息从死信主题“
移
回”到正常主题进行重新处理
的
最简单
方法
是什么
?
在
RabbitMQ中,您只需通过RabbitMQ仪表板移动消息;
在
kafka中是否有
浏览 26
提问于2020-07-02
得票数 1
回答已采纳
1
回答
正在
将
_temporary文件夹
的
内容移
动到
最终位置
hadoop
、
apache-spark
、
hadoop-yarn
Spark
将
正在处理
的
数据
存储
在
_temporary文件夹中。作业完成后,
数据
将
移
动到
其最终目标。但是,当有数万个分区
时
,
将
文件从一个位置移
动到
另一个位置需要相当长
的
时间。问:如何加快这一步?
在
纱线集群模式下
运行
应用程序
,
在
裸机Hadoop上
运行
,而不是
在
亚马逊网络服务上(没
浏览 17
提问于2018-03-06
得票数 0
1
回答
为什么Databricks连接测试不能在Mac上工作?
apache-spark
、
pyspark
、
databricks
我已经阅读了配置databricks-connect
的
文档,但是在
运行
databricks-connect test
时
仍然会遇到下面的错误java.lang.NoSuchMethodErrorcorrect result
将
火花控制设置为
spark
.databricks.service.ser
浏览 0
提问于2019-07-22
得票数 4
1
回答
如何在AWS Glue PySpark中
运行
并行线程?
apache-spark
、
pyspark
、
aws-glue
、
aws-glue-spark
我有一个火花作业,它将从具有相同转换
的
多个表中提取
数据
。基本上是一个for循环,它遍历一个表列表,查询目录表,添加时间戳,然后插入Redshift (下面的例子)。) glueContext = GlueConte
浏览 4
提问于2020-07-03
得票数 5
回答已采纳
3
回答
如何在库伯奈特斯上独立
运行
火种?
scala
、
apache-spark
、
kubernetes
我有一个Scala
应用程序
,它在独立模式下使用
Spark
2.1。
应用程序
将
运行
2小
时
并完成。它应该每月
运行
一次。我发现了几种结合
Spark
和Kubernetes
的
方法
: 大多数文档描述了如何在
浏览 4
提问于2017-06-26
得票数 3
1
回答
为什么我
的
iOS
应用程序
的
文档目录变成了一个文件?
ios
我们正在开发一个带有企业发行版
的
iOS
应用程序
。它在数百个设备中
运行
良好,但是我们发现一些iOS 6.1.3设备
在
第一次
运行
几个小时后未能启动它,因为
应用程序
的
文档目录变成了一个文件!除了从远程HTTP服务器下载大约80 MP4
的
MP4文件外,我们
的
应用程序
没有什么特别之处。 我以为它操作文档目录
时
出了问题,但到目前为止,我们
的
代码中没有什么“危险”用法
的
线索。你
浏览 3
提问于2013-11-20
得票数 0
回答已采纳
2
回答
在
jar中设置静态位置
时
异常
spark-java
我有一个基本
的
spark
-java
应用程序
,其中我
将
静态资源
的
位置设置为:当我
在
IDE中
运行
它
时
,当我尝试从jar
运行
它
时
,它工作得很好,我得到
spark
.staticfiles.StaticFilesConfiguration - Error when creating
浏览 0
提问于2016-08-20
得票数 1
1
回答
Spark
-自动化部署和性能测试
testing
、
sbt
、
bigdata
、
apache-spark
我们正在开发一个使用
Spark
& Hive进行静态和即席报告
的
应用程序
。对于这些静态报告,它们采用许多参数,然后在
数据
集上
运行
。我们希望能够更轻松地
在
群集上测试这些报告
的
性能。如果我们有一个测试集群
运行
,有足够
的
样本
数据
集,开发人员可以共享。为了加快开发速度,通过IDE
将
Spark
应用程序
部署到
Spark
集群(独立)
的
浏览 0
提问于2014-07-31
得票数 4
点击加载更多
相关
资讯
Spark Streaming 2.2.0 Input DStreams和Receivers
什么是 Apache Spark?大数据分析平台详解
如果你想月薪超过3万英镑,那么这项技能是必要的
大数据-Spark揭秘
大数据基础:Spark工作原理及基础概念
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券