下面是我想在Apache Flink中做的事情: 获取一个输入DataStream<T>,然后按字段x设置关键字,然后执行每分钟滑动一次的15分钟滑动窗口,聚合每个键(x)的结果,然后将所有这些聚合聚合到一个列表中基本上,如果我有一个输入流,[(a, 1, Time 1), (b, 6, Time 14), (b, 1, Time 12)],我希望结果是[(a, 1),
我们的Flink Job包含一个过滤器,按会话id键,然后是间隔30分钟的会话窗口。会话窗口将需要累积会话的所有事件,并使用ProcessWindowFunction处理它们。我们使用Flink 1.9,128个容器,总共20G内存来运行我们的作业,截止率是0.3。我们正在执行增量检查点。当会话窗口开始触发process函数时,网络缓冲区使用率开始变得非常高,然后我们开始得到Kafka输入滞后。我们的设置: stat