文章/答案/技术大牛

发布

首页视频【赵渝强老师】Kafka的体系架构

【赵渝强老师】Kafka的体系架构原创

2024-08-082024-08-08 09:22:55播放362

点赞0 收藏 0

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
本节课我们来讨论一下kafka的体系架构。Kafka是由Apache软件基金会开发的一个开源流处理平台，它是一种高吞吐量的分布式发布订阅消息系统。它具有以下的特点，一、高吞吐量kafka每秒可以处理数以千计的消息。2、支持数据的持久化。Kafka使用分布式提交日志，消息被写入到本地磁盘，以保证数据的持久性。3、支持数据并行处理。Kafka的topic由分区组成，每个分区被不同的节点处理，这样的设计允许kaf并行处理数据。4、容易向外扩展，Kaf克允许添加更多的服务器到集群中。5、支持数据复制kafka支持数据复制，可以跨数据中心进行数据的复制。6、支持实时处理。KA可以与流处理框架集成，如Spark和flink已进行实施处理，了解到了基本的知识后，下面详细讨论一下卡F克的体系架构。在卡F克的体系架构中，主要包含两种不同的角色。
01:00
色。1、生产者producer，它负责生产消息，消息可以是字符串，也可以是对象。在Kaf克集群中可以有多个生产者。2、消费者consumer，它负责消费处理消息。如前面提到的Spark和flink都可以看成是kafka的消费者。Kafka采用消费者组管理消费者，例如这里有两个消费者组，消费者组1和消费者组2。消费者组1中包含两个成员，消费者组2中包含一个成员。在一个kaf克集群中可以包含多个message server, 这里可以将message server看成是一个物理机，在每一个message server上可以运行一个或者多个broker。同一个集群中的broker具有不同的ID号，例如这里的BROKER0BROKER1、BROKER2BROKER是真正用于接收生产者消息，将消息持久化存储并最终将消息转发给消费者的组件kafka需要将其源信息存储在zooukeeper中。但从2.8版本开。
02:00
使kafka逐步放弃对zookeeper的依赖，生产者将消息发布到broker上，消费者从broker上订阅消息。由于Kafka只支持KA类型的广播消息，且同一个分区中的消息只能被一个消费者组中的一个成员消费处理。例如，当消费者组1中的消费者A消费处理了一条消息，那么消费者B就不能消费处理该条消息了，但该条消息任可以被消费者C消费处理。当消费者A出现了宕机的情况，消费者B可以接替消费者A进行消息的消费处理。通过这样的方式实现了消费者的高可用功能。现在你已经知道kafka的体系架构了，那你知道卡夫克的数据模型吗？欢迎评论区留言讨论好了记得点加号关注赵玉强老师。

展开

我来说两句

0 条评论

登录后参与评论

作者

赵渝强老师

【合辑】大数据技术

（26/60）

1分9秒

【赵渝强老师】Hive的单字段动态分区表

1K0

1分9秒

【赵渝强老师】Hive的半自动动态分区表

6640

1分8秒

【赵渝强老师】Hive的多字段全动态分区表

4680

1分14秒

【赵渝强老师】Hive的分区表

3770

1分11秒

【赵渝强老师】Hive的静态分区表

6530

1分24秒

【赵渝强老师】Hive的数据模型

3770

1分34秒

【赵渝强老师】Hive的内部表

3730

1分25秒

【赵渝强老师】Hive的外部表

3690

1分41秒

【赵渝强老师】大数据技术的理论基础

3860

1分33秒

【赵渝强老师】大数据生态圈中的组件

3660

1分24秒

【赵渝强老师】大数据主从架构的单点故障

3420

1分35秒

【赵渝强老师】HDFS的HA

3720

3分53秒

【赵渝强老师】数据仓库与大数据

9770

1分15秒

【赵渝强老师】Spark中的RDD

1.1K0

2分27秒

【赵渝强老师】基于RBF的HDFS联邦架构

2.3K0

1分41秒

【赵渝强老师】Spark中的DStream

1.1K0

1分25秒

【赵渝强老师】Spark中的DataFrame

3540

2分29秒

【赵渝强老师】基于ViewFS的HDFS联邦架构

1.8K0

2分11秒

【赵渝强老师】Kafka分区的副本机制

3930

1分28秒

【赵渝强老师】Kafka的主题与分区

3530

2分39秒

【赵渝强老师】阿里云大数据生态圈体系

3660

2分14秒

【赵渝强老师】MapReduce计算模型

3580

2分33秒

【赵渝强老师】Hive的体系架构

3790

2分22秒

【赵渝强老师】HBase的表结构

3570

2分35秒

【赵渝强老师】HBase的体系架构

1.4K0

2分47秒

【赵渝强老师】Kafka的体系架构

3620

2分0秒

【赵渝强老师】数据集成的大数据流批一体架构

3880

2分18秒

【赵渝强老师】数据仓库的流批一体架构

3950

2分22秒

【赵渝强老师】数据湖的流批一体架构

3640

2分53秒

【赵渝强老师】HDFS数据上传的过程

3510

3分20秒

【赵渝强老师】Hadoop的本地模式

3850

2分43秒

【赵渝强老师】HDFS数据下载的过程

3700

3分20秒

【赵渝强老师】Flink生态圈组件

3570

3分14秒

【赵渝强老师】Yarn的资源调度策略

3430

3分48秒

【赵渝强老师】Spark生态圈组件

3630

3分24秒

【赵渝强老师】Hadoop生态圈组件

3600

3分44秒

【赵渝强老师】大数据平台的Lambda架构

1.3K0

3分4秒

【赵渝强老师】大数据平台的Kappa架构

3740

1分51秒

【赵渝强老师】SparkRDD的窄依赖关系

3730

1分49秒

【赵渝强老师】Spark RDD的宽依赖关系

3830

2分3秒

【赵渝强老师】如何划分Spark任务的执行阶段

1.4K0

1分36秒

【赵渝强老师】Spark的容错机制-检查点

3720

1分31秒

【赵渝强老师】Spark RDD的缓存机制

9210

1分36秒

【赵渝强老师】Kafka生产者的执行过程

8300

1分44秒

【赵渝强老师】Kafka生产者的消息发送方式

8390

1分37秒

【赵渝强老师】Kafka的消费者与消费者组

8270

1分32秒

【赵渝强老师】Kafka消息的消费模式

8140

1分58秒

【赵渝强老师】HDFS的体系架构

1.7K0

1分55秒

【赵渝强老师】大数据的学习路线

1.1K0

1分48秒

【赵渝强老师】为什么Spark中不存在真正的实时计算

3590

4分11秒

【赵渝强老师】大数据平台的Lambda架构

1.4K0

3分41秒

【赵渝强老师】大数据平台的Kappa架构

3460

3分54秒

【赵渝强老师】Hadoop生态圈组件

6850

3分32秒

【赵渝强老师】Spark生态圈组件

3700

3分35秒

【赵渝强老师】Flink生态圈组件

3610

1分4秒

【赵渝强老师】大数据交换引擎Sqoop

3620

1分22秒

【赵渝强老师】Hadoop HDFS的快照

3560

1分31秒

【赵渝强老师】大数据日志采集引擎Flume

3580

1分38秒

【赵渝强老师】大数据的湖仓一体架构

1.1K0

1分23秒

【赵渝强老师】Hadoop的伪分布部署模式

2650

【赵渝强老师】Kafka的体系架构原创

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐