首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何从卡夫卡获得至少N个圆木数通过火花?

如何从卡夫卡获得至少N个圆木数通过火花?
EN

Stack Overflow用户
提问于 2021-01-22 06:50:57
回答 1查看 107关注 0票数 2

在星火流中,当它们到达时,我得到了日志。但是我想在一次传递中得到至少N个日志。如何才能做到这一点?

的回答来看,卡夫卡似乎有这样一个实用工具,但似乎不在星火中却让它成为可能。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-01-22 07:20:55

没有任何选项允许您设置从Kafka收到的消息数量的最小值。选项maxOffsetsPerTrigger允许您设置最大的消息。

如果您希望您的微批处理同时处理更多消息,您可以考虑增加触发间隔。

此外(指你提供的链接),这也是不可能设置在卡夫卡本身。您可以设置获取字节的最小数量,但不能设置最小数量的消息号。

注意,您可以通过readStream通过前缀kafka.在结构化流中设置所有Kafka选项,如卡夫卡特殊配置一节所解释的。

卡夫卡自己的配置可以通过DataStreamReader.option设置,前缀为kafka.前缀,例如,stream.option("kafka.bootstrap.servers",“主机:端口”)。

这样,您还可以使用Configuration kafka.fetch.min.bytes。但是,在loval Kafka 2.5.0安装上用Spark3.0.1测试它不会产生任何影响。当添加配置kafka.fetch.max.wait.ms时,我的测试中的获取时间确实发生了变化,但没有以可预测的方式(至少对我来说)。

查看Spark的KafkaDataConsumer的源代码,与纯KafkaConsumer相比,fetch似乎没有直接计算任何min/最大字节。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65840541

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档