首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

产品速递|迈向云原生时代的统一采控平台

为凝聚技术精华与行业实践,分享产品亮点与方法论,广通优云特推出【产品速递】系列栏目。

资深的产研专家,丰富的项目经验,为您带来最新技术干货与一线实战案例。让我们共赴IT运营数字化未来!

作者|优云产品团队

本文约2300字|预计阅读时间:10分钟

随着云原生时代的全面来临,企业运维业务要求不断提高、运维环境复杂度不断提升,原有运维工具业务针对性强且互不兼容、功能耦合扩展难,无法组合形成体系化采控,难以满足云原生时代运维能力发展诉求。

因此,企业往往需要统一规划、统一标准、统一建设面向资源的采控体系。而在构建统一采控的过程当中,各种挑战也浮出水面:

采控场景复杂:私有云、公有云、混合云融合形成多云环境,传统运维工具难以将云上云下运维打通;同时,大数据、微服务、容器、不可变基础设施和声明式API等新技术被广泛使用,导致采控难度变大;

采控竖井建设:采控工具种类繁杂,工具场景相对单一且封闭,无法统一对外提供服务,无法支撑日常运维需求,采控代理管理能力重复建设;同时采控代理在业务机器野蛮生长,对业务造成潜在影响,缺乏对代理统一管控能力。

服务化&统一化

剖析统一采控建设思路

优云在助力各行业头部用户提升运维管理能力的过程中发现,面对以上挑战,企业想要高效、敏捷地进行统一采控建设,应从服务化和统一化两个方面考虑。

服务化:面向配置管理的资源分类体系关联采控能力,形成标准化的插件,解耦业务、沉淀知识,实现高复用;同时将采控能力封装为 “开箱即用”的服务API,方便运维系统开展各类采控作业,实现“采控即服务”;

统一化:在被管资源层避开“竖井式”Agent建设,通过统一Agent提供一致资源交互能力;同时,在采控能力层提供统一插件扩展规范,方便快速丰富采控能力以及整合第三方工具和代理。

优云统一采控基于以上原则构建面向被管对象统一采控通道、分布式多层级采控能力、可扩展采控框架。

对上屏蔽多云、传统架构、信创的资源环境异构性,提供可观测、资源发现、自动化操作等开箱即用的采控能力,通过服务化方式提供上层应用调用,让业务运维专注于业务本身。

实现统一采控

让运维专注业务

封装IT环境异构性,构建统一采控通道

统一各运维工具和被管设备资源之间联络通讯的通道,提供采集策略、自动化任务、配置采集任务接口,屏蔽采控通道复杂性,让上层专注业务实现,并通过API的认证、网段限制、权限管理等管控服务调用范围。

同时,提供采集策略、控制指令和文件传输的统一管理调度,指令经过加密签名后按照采控拓扑,经由高效、安全和可扩展传输通道传递至代理,轻松实现万级节点并发调度的同时保障任务一致性,防丢失,并保证管控安全性。

OneAgent实现资源统一采控

统一代理采用“统一框架+热插拔业务插件”的方式实现不同运维业务场景,被管主机上只需部署一个代理即可完成所有采集和控制的操作,降低对被管主机资源占用的同时,降低代理的管理复杂度。

统一通信:统一框架提供与服务端统一通信通道,统一应对复杂网络情况;

统一调度:统一调度提供不同优先级的异步执行能力,避免任务执行阻塞,同时具备任务唯一性的识别机制,防止任务重复执行;

自我管理:代理具备进程异常自愈能力,避免运维业务中断;支持资源消耗管理以及监测,对消耗异常主动熔断。

多数据中心分布式、行业集约化采控

通过组建代理集群构建多层级、分布式、负载均衡的采控能力,通过双活管理区和多活计算区集约化模式,实现行业集约化采控。

大规模:单传输通道支持万级节点并发连接,单数据中心支持10W+代理接入,中远期能支持百万级;

高并发:采集策略、控制指令万级节点并发执行,秒级下发执行代理;

高稳定:集群均采用高可用和负载均衡,确保采控指令准确送到,采控指令执行成功率达到99.999%。

适配扩展框架灵活,全面整合现有采控

通过插件灵活扩展方式,能够对各类监控工具、操作工具、云平台等三方工具或平台进行适配集成,三方代理按照采控适配规范改造后可实现三方代理生命周期以及通信全方位管控,对代理、数据统一管控,保障数据质量、可追溯。通过新增采控适配工具,实现三方平台集成管控。

深化采控服务建设,拓展采控云原生体系

在服务上云的大趋势下,基础设施的概念已经不再局限于IaaS 层。云原生时代,开发者的焦点逐渐聚集到了应用上。即:以应用为中心。

统一采控提供面向资源和面向应用的IaC(Infrastructure as Code)能力,通过统一的模型来描述云资源、自建基础设施和各种企业应用,将各大云厂商和Kubernetes服务整合并统一为面向开发者的 IaC 规范,实现纳管云资源和容器生态丰富的运维能力,以及面向复杂应用的统一编排。

优云为客户提供一站式接入覆盖基础组件层和业务应用层的云原生可观测方案,构建全面的可观测技术体系,帮助客户深入的掌握系统运行状态。统一采控通过引入eBPF技术实现无侵入式链路信息采集,为全链路拓扑构建和监控提供原数据支撑;通过OneAgent实现Metrics、Tracing和 Logging采集,提供从基础组件到业务应用系统的全景监控的服务化能力。

目前,优云采控平台已经在各大头部用户落地实践,累计纳管100万+节点,连续多年运行无故障, 输出100+资源类型的标准发现和可观测采集能力,3000+标准指标,为上层应用提供全面的服务支撑。

未来,也将继续总结并沉淀行业头部客户服务与共创经验,持续提升采控平台体系化能力与服务化水平,助力企业在云原生时代实现运维能力发展与数字化演进。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221201A02I9B00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券