Kappa架构则只使用流处理来处理数据,将所有数据都视为实时数据进行处理。这样可以简化架构,并且可以实现更低的延迟和更高的吞吐量。...,用于实时数据处理
Samza:流式处理框架,基于Kafka和YARN,由LinkedIn开发
Beam:统一批流处理模型,实现无缝切换,由Apache开源
其他:
YARN:资源调度平台,用于在Kappa...Streaming、Storm、Samza、Beam 等
消息队列:Kafka
资源调度:YARN
分布式存储:HDFS
协调服务:Zookeeper
这些框架和技术通过流式计算和消息队列实现了Kappa...其中,Flink和Spark Streaming作为新一代的流式计算框架,被广泛使用在Kappa架构中。Samza和Beam也具有流计算能力,但使用较少。...Storm作为老牌流计算框架,其使用也在逐渐减少。
Kafka作为消息队列,是整个Kappa架构中最为核心的技术,用于收集和传输实时数据流。