腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9715)
视频
沙龙
1
回答
使用
Direct
Kafka
API
运行
spark
流媒体
应用
所需
的
最佳
资源
是什么
?
python
、
pyspark
、
apache-kafka
、
spark-streaming
我
使用
直接
的
Kafka
API
以1分钟
的
批处理间隔
运行
我
的
spark
流媒体
应用
程序,并在我
的
应用
程序代码中
使用
Pandas和Pyspark。下面是我
的
集群配置:3个数据节点,每个数据节点具有8核、12 my
的
容量。我已经提供了如下参数
的
spark
-submit作业, --master yarn
浏览 14
提问于2017-08-28
得票数 1
1
回答
如何通过
spark
结构流在
Kafka
中以编程方式创建主题
apache-spark
、
apache-kafka
、
spark-structured-streaming
我想在我
的
Spark
结构化
流媒体
应用
程序中创建多个
kafka
主题
运行
时。我发现Java
API
中有各种可用
的
方法。但我找不到任何有
Spark
结构
的
流媒体
。如果有什么方法可以
使用
或者我需要
使用
java库,请告诉我。 我
的
apache
Spark
版本是2.4.4,
Kafka
库依赖是
spark
-sq
浏览 17
提问于2019-11-28
得票数 0
2
回答
5分钟
Spark
批处理作业与流作业
apache-spark
、
spark-streaming
我正在试着找出什么是更好
的
方法。 我有一个火花批处理作业,这是计划
运行
每5分钟,它需要2-3分钟来执行。由于已经添加了对动态分配
spark
.streaming.dynamicAllocation.enabled
的
支持,将其设置为每5分钟从源拉取数据
的
流式作业是一个好主意吗?
浏览 0
提问于2019-07-24
得票数 0
1
回答
消费500个
Kafka
主题并编写拼图最好
的
策略
是什么
?
apache-spark
、
apache-kafka
、
apache-flink
我有500个
Kafka
主题。其中有些是TB级
的
;有些是每小时MB级
的
。 我想将它们缓冲五分钟,并将它们作为拼图文件写入到S3上
的
特定位置。我正在尝试为我
的
Spark
或Flink
的
问题找到
最佳
的
解决方案。 对于
Spark
,我可以
使用
结构化
流媒体
来消费
Kafka
,并按主题编写逻辑。如果我每个主题都有
应用
程序,我会浪费大量
的
资
浏览 13
提问于2020-04-18
得票数 0
2
回答
如何
使用
direct
stream在
Kafka
Spark
Streaming中指定消费群
java
、
apache-spark
、
apache-kafka
、
spark-streaming
、
kafka-consumer-api
如何
使用
直播流
API
指定
kafka
spark
流
的
消费组id。
使用
spark
1.3 kafkaParams.put("group.id", "app1");
浏览 0
提问于2016-04-09
得票数 7
回答已采纳
2
回答
在本地机器上集成
Spark
Kafka
进行实时twitter
流媒体
分析
的
缺点
是什么
?
apache-spark
、
apache-kafka
、
spark-streaming
、
twitter-streaming-api
、
spark-streaming-kafka
我正在
使用
Spark
-
Kafka
集成在我
的
项目上工作,这是找到twitter上
的
热门标签。为此,我
使用
Kafka
通过tweepy Streaming推送推文,而在消费者端,我
使用
Spark
Streaming进行DStream和RDD转换…… 我
的
问题是,通过
Kafka
运行
流媒体
进程一段时间是否会导致存储问题,因为我在本地机器上同时
运行
生产者和消
浏览 41
提问于2020-01-06
得票数 0
回答已采纳
1
回答
Spark
1.5作为
KAFKA
0.9或0.10
的
客户端
apache-spark
、
kafka-consumer-api
我可以
使用
Kafka
consumer
API
编写
Spark
1.5客户端,从
KAFKA
0.9或0.10获取消息并对其进行处理吗?如果不能,那么
使用
Spark
作为处理引擎获取消息并
应用
聚合和统计建模以生成最终输出
的
最佳
方式
是什么
?
浏览 1
提问于2016-07-28
得票数 0
1
回答
API
调用
的
Spark
Streaming架构
spring-boot
、
architecture
、
spark-streaming
这更像是一篇关于在
spark
streaming中做一些事情
的
适当方式
的
调查文章。我有一个接受
Kafka
Stream
的
Spark
流媒体
应用
程序。在
Kafka
流中,对于我们收到
的
每条消息,我调用了2个
API
,它们将命中我在Postgres数据库上
运行
的
Spring Boot服务器。我需要访问
API
服务器
的
原因是,随着时间
浏览 0
提问于2016-09-02
得票数 1
2
回答
如何通过
kafka
使用
来自其他虚拟机
的
Spark
流
apache-spark
、
virtual-machine
、
apache-kafka
、
spark-streaming
我在一个虚拟机上有
Spark
Streaming,我想把它连接到另一个包含
kafka
的
虚拟机上。我要斯帕克从卡夫卡机器里拿到数据。这样做有可能吗? 谢谢
浏览 15
提问于2016-08-26
得票数 0
回答已采纳
1
回答
从
Spark
streaming读取
Kafka
SSL客户端信任库文件时出错
ssl
、
apache-kafka
、
spark-streaming
我有一个
Spark
流媒体
应用
程序从
Kafka
读取。我在电子病历上
运行
它。最近我实现了
Kafka
SSL。我正在创建
Kafka
客户端,如下所示。当
应用
程序试图读取信任库文件时,我在
运行
应用
程序时遇到一个奇怪
的
错误。: /tmp/
kafka
.client.truststore.jks (No such file or directory) 导致此问题
的</e
浏览 21
提问于2019-12-11
得票数 1
回答已采纳
2
回答
Spark
Streaming:
Kafka
重启后输入速率不正常
apache-kafka
、
spark-streaming
我目前正在
spark
上
运行
一个
流媒体
应用
程序,它
使用
新
的
直接方法(没有接收器)消费一个简单
的
kafka
主题。由于我们在
Kafka
集群上遇到了一些问题,即使在
Kafka
上恢复正常后,
流媒体
应用
程序也遇到了一些问题:一些作业正在处理几乎空
的
rdd,而另一些作业正在处理两倍大小
的
rdd。我试着重启
应用
程序,但没有什么不同。我在
浏览 0
提问于2016-05-18
得票数 0
1
回答
无法读取卡夫卡火花流中
的
数据
pyspark
、
spark-streaming
、
databricks
、
spark-streaming-kafka
我正在创建一个基本
的
流媒体
应用
程序,它从
kafka
读取流数据并处理这些数据。下面的代码是我正在尝试
的
df =
spark
\.option("truncate", False)\ .l
浏览 6
提问于2022-08-29
得票数 0
2
回答
Kafka
流并发?
apache-kafka
、
apache-kafka-streams
我有一些基本
的
Kafka
流代码,可以从一个主题读取记录,进行一些处理,并将记录输出到另一个主题。如果它是多线程
的
,我需要了解它是如何工作
的
,以及如何处理
资源
,比如SQL数据库连接应该在不同
的
处理线程中共享。相对于其他选项(
Spark
、Akka、Samza、Stor
浏览 1
提问于2016-10-12
得票数 27
回答已采纳
2
回答
Spark
结构化
流媒体
应用
阅读多个
Kafka
主题
apache-spark
、
apache-kafka
、
spark-structured-streaming
我有一个
Spark
结构化
流媒体
应用
(v2.3.2),它需要从一些
Kafka
主题读取,做一些相对简单
的
处理(主要是聚合和一些连接),并将结果发布到其他一些
Kafka
主题。因此,在同一个
应用
程序中处理多个流。 我想知道从
资源
的
角度(内存、执行器、线程、
Kafka
侦听器等)它是否会有所不同。如果我只设置一个直接readStream,它订阅多个主题,然后
使用
selects拆分流,而不是每个主题1个readS
浏览 28
提问于2019-05-01
得票数 11
回答已采纳
1
回答
BeanCreationException:在
Spark
-Submit上创建名为'defaultValidator‘
的
bean时出错
spring-boot
、
apache-spark
、
apache-spark-sql
、
spark-submit
、
bootrun
使用
spring boot创建了
spark
结构
的
流媒体
应用
程序。bootRun
运行
良好,但在
使用
"
spark
-submit“部署相同
的
jar时,给出了以下错误:compile('org.apache.
spark
:
浏览 1
提问于2018-09-23
得票数 0
1
回答
Kafka
消费者请求超时
apache-spark
、
apache-kafka
、
spark-streaming
我有一个
Spark
streaming (Scala)
应用
程序
运行
在CDH 5.13中,
使用
client 0.10.0
使用
Kafka
的
消息。我
的
Kafka
集群包含3个代理。
Kafka
topic被划分为12个分区,均匀分布在这3个代理之间。我
的
Spark
流媒体
客户有12个执行器,每个执行器都有一个核心。
Spark
streaming开始从
浏览 0
提问于2018-10-09
得票数 1
1
回答
哪些文件系统可用于检查点设置
apache-spark
、
hdfs
、
spark-streaming
、
checkpointing
文档说,任何与Hadoop
API
兼容
的
文件系统(如HDFS、S3 )都可以用作检查点目录。我
的
问题是,除了HDFS和S3之外,
使用
Kafka
和Cassandra
的
spark
流媒体
应用
程序还有什么其他实用
的
替代方案。 谢谢
浏览 2
提问于2016-01-07
得票数 1
1
回答
星火(直接)流
的
自然替代品是星火结构化流还是卡夫卡流?
apache-spark
、
apache-kafka
、
spark-streaming
、
apache-kafka-streams
、
spark-structured-streaming
在过去几年中,我们开发了相当多
的
星火流(
Direct
)
应用
程序,这些
应用
程序正在我们
的
Cloudera平台上读取或写入
Kafka
、IBM、Hive、HBase、HDFS和其他
应用
程序。现在取消了
Spark
流
的
Direct
(我们目前有2.3.2版本),并且我们最近向我们
的
项目添加了汇合平台(附带了
Kafka
2.2.0),我们计划迁移这些
应用
程序。我们
的
浏览 4
提问于2020-02-19
得票数 0
回答已采纳
1
回答
如何从
Kafka
访问记录中
的
文件路径并从创建数据集?
java
、
apache-spark
、
apache-kafka
、
spark-structured-streaming
我
使用
的
是Java。我能够从
Kafka
消息中检索到文件路径。我不能在
Kafka
消息数据集上
运行
map函数。由于sparkContext在worker上不可用,因此出现NPE错误。 我不能在
Kafka
消息数据集上
运行
foreach。,并且必须在很多设置中
运行
。如何从
Kaf
浏览 0
提问于2017-09-26
得票数 4
1
回答
Kafka
1.0 Streaming
API
: partitions消息消费延迟
java
、
apache-kafka
、
apache-kafka-streams
最近,我将我们
的
流媒体
应用
程序从
spark
-streaming 2.1切换到
使用
kafka
-streaming新
API
(1.0)和
kafka
broker服务器0.11.0.0我在一台内存为32 GB、内核为8核
的
机器上
运行
了100线程
的</e
浏览 17
提问于2018-02-14
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券