Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Cruise Control增强Kafka负载均衡

Cruise Control增强Kafka负载均衡

作者头像
大数据杂货铺
发布于 2020-10-29 02:13:13
发布于 2020-10-29 02:13:13
1.2K0
举报
文章被收录于专栏:大数据杂货铺大数据杂货铺

Cruise Control是一个Kafka负载平衡组件,可以在大型Kafka集群中安装使用。在添加或删除Kafka代理时,Cruise Control可以根据特定条件自动平衡分区。

Cruise Control的体系结构由负载监控器、分析器、异常检测器和执行器组成,如下图所示。

负载监控器

基于标准Kafka指标和资源指标生成集群工作负载模型,以利用磁盘、CPU、字节输入速率和字节输出速率。将集群模型输入到异常检测器和分析器中。

分析仪

根据用户提供的优化目标以及来自Load Monitor的集群工作负载模型,生成优化建议。可以设定硬目标和软目标。必须实现硬目标,而如果达到硬目标,则软目标将无法实现。如果优化结果违反了硬目标,则优化将失败。

异常检测器

负责检测以下异常:

异常现象

原因

结果

Broker失败

非空Broker崩溃或离开集群。

Cruise Control通过删除故障的broker来修复集群。

违反目标

优化被违反。

如果启用了自我修复,Cruise Control会自动分析工作负载并执行优化建议。

磁盘故障

非空磁盘死亡。

如果启用了自我修复功能,则Cruise Control会将所有脱机副本移至正常代理。

指标异常

收集的指标异常。

可能会先降级,如果异常仍然存在,请根据self.healing.slow.brokers.removal.enabled配置删除速度慢的broker 。

执行器

执行优化建议,执行建议时可以安全地中断它。执行始终是资源感知的过程。

检索指标

Cruise Control使用Kafka存储和检索其指标,该指标由Metric Fetcher读取。

在负载监视器中,Metric Fetcher Manager负责协调所有采样任务:Metric采样任务,Bootstrap任务和线性模型训练任务。

每个采样任务都由配置数量的Metric Fetcher线程执行。每个Metric Fetcher线程使用一个可插入的Metric Sampler来获取样本。每个Metric Fetcher都在集群中分配了几个分区以获取样本。指标标准样本由指标标准样本聚合器组织,该指标标准聚合器根据指标标准样本的时间戳将每个指标标准样本放入工作负载快照中。

集群工作负载模型是负载监视器的主要输出。集群工作负载模型反映了集群的当前副本分配,并提供了移动分区或副本的接口。分析器使用这些接口来生成优化解决方案。

样本存储区存储指标标准和训练样本以供将来使用。

借助指标标准采样器,您可以将Cruise Control部署到各种环境并与现有的指标标准系统一起使用。

在Cloudera环境中使用Cruise Control时,将HttpMetricsReporter 指标报告给Cloudera Manager时间序列数据库。结果,可以使用Cloudera Manager读取Kafka指标。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-10-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Kafka 负载均衡在 vivo 的落地实践
Kafka 客户端可以使用分区器依据消息的key计算分区,如果在发送消息时未指定key,则默认分区器会基于round robin算法为每条消息分配分区;
2020labs小助手
2022/06/06
8650
Kafka万亿级消息实战
本文主要总结当Kafka集群流量达到 万亿级记录/天或者十万亿级记录/天  甚至更高后,我们需要具备哪些能力才能保障集群高可用、高可靠、高性能、高吞吐、安全的运行。
2020labs小助手
2021/05/18
1.1K0
案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 2 部分 - 迁移)
上一篇文章,我们详细介绍了开发基于 PaaSTA 的新部署模型的架构和动机。现在想分享我们将现有 Kafka 集群从 EC2 无缝迁移到基于 Kubernetes 的内部计算平台的策略。为了帮助促进迁移,我们构建了与集群架构的各种组件接口的工具,以确保该过程是自动化的,并且不会影响用户读取或写入 Kafka 记录的能力。
灵雀云
2022/08/12
1.1K0
案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 2 部分 - 迁移)
Kafka在美团数据平台的实践
总第526篇 2022年 第043篇 Kafka在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka面临的挑战也愈发严峻。本文分享了美团Kafka面临的实际挑战,以及美团针对性的一些优化工作,希望能给从事相关开发工作的同学带来帮助或启发。 1. 现状和挑战 1.1 现状 1.2 挑战 2. 读写延迟优化 2.1 概览 2.2 应用层 2.3 系统层 2.4 混合层-SSD新缓存架构 3. 大规模集群管理优化 3.1 隔离策略 3.2 全链路监控 3.3 服务生命周期
美团技术团队
2022/08/26
7420
Kafka在美团数据平台的实践
Kafka监控工具汇总
对于大数据集群来说,监控功能是非常必要的,通过日志判断故障低效,我们需要完整的指标来帮我们管理Kafka集群。本文讨论Kafka的监控以及一些常用的第三方监控工具。
用户6070864
2019/08/27
2K0
Kafka监控工具汇总
FAQ系列之Kafka
“流媒体”:发布者(“生产者”)经常发送的大量消息(想想数万或数十万)。许多订阅者(“消费者”)经常进行消息轮询。
大数据杂货铺
2021/07/27
1.1K0
FAQ系列之Kafka
0891-CDP Private Cloud Base 7.1.8正式GA
八月再见,九月你好,今天是九月一日,新学年开始,Cloudera正式发布CDP Base 7.1.8和Cloudera Manager 7.7.1。这个版本引入了诸多新功能,比如通过EC提升Ozone的存储效率,Cloudera Manager的HA,多NameNode支持,全面支持Impala4.0,Hive性能提升,HDFS/Schema Registry血缘功能的增强,改进Ranger RMS,以及实时平台的全面增强。 1.平台支持增强 1.新的操作系统支持 CDP Private Cloud Ba
Fayson
2022/09/02
1.1K1
10 Confluent_Kafka权威指南 第十章:监控kafka
Apache Kafka有许多针对其操作的度量,这些度量指标非常多,会让人混淆哪些是重要的,哪些是可以忽略的。这些度量的范围从关于通信量总体速率的简单度量,到针对每种请求类型的详细时间度量,再到每个topic和每个分区的度量。他们提供了broker中的每个操作的详细视图,但也可能使你成为负责管理监视系统的人员的缺点。 本节将详细介绍一直要监控的最关键的度量标准,以及如何响应他们。我们还将描述一些再调试问题的时候需要账务的更重要的度量标准,然而,这并不是可用的度量标准的详细列表,因为列表经常发生变化,而且其中有许多只对硬编码的kafka开放人员有用。
冬天里的懒猫
2020/08/03
2.4K0
案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 1 部分 - 架构)
在 Yelp,Kafka 每天接收数百亿条消息来推进数据驱动并为关键业务管道和服务提供支持。我们最近通过在 PaaSTA (Yelp 自己的平台即服务)上运行集群,对 Kafka 部署架构进行一些改进。基于 K8s 的部署利用了 Kafka 的自定义 Kubernetes operator 以及用于生命周期管理的 Cruise Control 。
灵雀云
2022/08/12
6220
案例分享 | Yelp 如何在 Kubernetes 上运行 Kafka(第 1 部分 - 架构)
【夏之以寒-kafka专栏 01】 Kafka核心组件:从Broker到Streams 矩阵式构建实时数据流
Broker:在Kafka中,Broker是Kafka集群中的一个节点,负责处理Kafka中的核心功能。从物理层面来看,Broker可以是单独的一台服务器,也可以是集群中的一个节点。从逻辑层面来看,Broker是Kafka服务端的实现,负责接收生产者发送的消息,并将这些消息转发给消费者。Broker是Kafka实现分布式、高吞吐、高可靠性的关键组件。
夏之以寒
2024/05/26
3230
Kafka监控系统对比
github地址 : https://github.com/smartloli/kafka-eagle
用户5252199
2022/04/18
2K0
Kafka监控系统对比
如何更好地使用Kafka?
点个关注👆跟腾讯工程师学技术 引言| 要确保Kafka在使用过程中的稳定性,需要从kafka在业务中的使用周期进行依次保障。主要可以分为:事先预防(通过规范的使用、开发,预防问题产生)、运行时监控(保障集群稳定,出问题能及时发现)、故障时解决(有完整的应急预案)这三阶段。 事先预防 事先预防即通过规范的使用、开发,预防问题产生。主要包含集群/生产端/消费端的一些最佳实践、上线前测试以及一些针对紧急情况(如消息积压等)的临时开关功能。 Kafka调优原则: 1.确定优化目标,并且定量给出目标(Kafka
腾讯云开发者
2022/11/28
1.2K0
如何更好地使用Kafka?
使用Kafka Assistant监控Kafka关键指标
Kafka Assistant下载地址:http://www.redisant.cn/ka
用户3871926
2022/12/02
1.1K1
如何在CDH集群中部署Kafka Manager
为了能够方便的查看及管理Kafka集群,yahoo提供了一个基于Web的管理工具(Kafka-Manager)。这个工具可以方便的查看集群中Kafka的Topic的状态(分区、副本及消息量等),支持管理多个集群、重新分配Partition及创建Topic等功能。本篇文章Fayson主要介绍如何在CDH集群中部署Kafka-Manager并简单的介绍使用。
Fayson
2018/09/29
4.4K0
保姆级Kafka 降本实用指南
根据 Gartner 的预测,预计在 2021 年,全球终端用户在公共云服务上的支出将在 2020 年的 2700 亿美元基础上增长 23%,达到 3320 亿美元。
大数据老哥
2021/08/25
5120
保姆级Kafka 降本实用指南
Kafka的灵魂伴侣Logi-KafkaManger(3)之运维管控--集群列表
有想进滴滴LogI开源用户群的加我个人微信: jjdlmn_ 进群(备注:进群) 群里面主要交流 kakfa、es、agent、LogI-kafka-manager、等等相关技术; 群内有专人解答你的问题 对~ 相关技术领域的解答人员都有; 你问的问题都会得到回应
石臻臻的杂货铺[同名公众号]
2021/07/14
2860
Kafka系列之高频面试题
ISR是由Leader维护,Follower从Leader同步数据有一些延迟,超过配置的阈值会把Follower剔除出ISR,存入OSR列表,新加入的Follower也会先存放在OSR中。AR=ISR+OSR。
johnny666
2024/09/21
1720
Kafka最佳实践
要确保Kafka在使用过程中的稳定性,需要从kafka在业务中的使用周期进行依次保障。主要可以分为:事先预防(通过规范的使用、开发,预防问题产生)、运行时监控(保障集群稳定,出问题能及时发现)、故障时解决(有完整的应急预案)这三阶段。
星沉
2024/07/25
6800
Kafka最佳实践
读Kafka Consumer源码
这是OpenMessaging-Java项目GitHub上的一段介绍,大致是说OpenMessaging项目致力于建立MQ领域的标准。
林一
2018/07/24
9050
读Kafka Consumer源码
kafka中文文档
之前的版本:0.7.x,0.8.0,0.8.1.X,0.8.2.X,0.9.0.X,0.10.0.X。
gemron的空间
2019/11/04
15.6K0
kafka中文文档
相关推荐
Kafka 负载均衡在 vivo 的落地实践
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档