背景:I有一个在Kubernetes中运行的应用程序,它使用Kafka作为集中消息总线。我的应用程序中的Kafka客户端可能非常慢。Kafka在随后的轮询()调用之间等待的最长时间(在将成员踢出组和重新平衡之前)由max.poll.interval.ms控制。
对于这个应用程序中的大多数工作人员,我可以将max.poll.interval.ms设置为几分钟的顺序。然而,对于速度较慢的工人,我需要将其设置为几个小时。
当一切正常工作时,这不会引起问题。然而,在网络中断或间歇性崩溃的情况下,我注意到最大投票间隔很大的工作人员可能会“陷入”再平衡。如果我在发生这种情况时查看代理,并执行以下操作
ka