新财年,随着公司 IT 架构的复杂和应用数量的不断追加,运维工作愈发繁杂。在更新自身知识体系的同时,寻找更优的解决方案成为运维主管老凡的重点突破方向。
最近公司要上线新产品,开完需求沟通会议后,老凡打开了自己的工作日记,写道——
3月5日 周一
工作日记
新产品主要功能:监控网站 PV 和网页加载时间,并做基于浏览器、运营商、省份地域等的多维度分析、降噪处理及实时展现。
运维重点:
提升系统故障时日志的搜索速度,提升工作并做好云备份。
增强系统对日志的分析能力,挖掘数据价值,快速发现故障原因。
由于目前系统做了高可用和后端的均衡负载,老凡发现:因为当前服务器存储有限,均衡负载会随时切换服务器,导致系统日志无法统一存储,这将严重影响故障发生时的日志搜索,降低工作效率;在对日志的分析上,因为免费分析工具的耗资源、不稳定、速度慢等缺点,老凡开始考虑是否要额外采购一套分析工具。此时,他想起了不久前赵总在微信时提到的“智能运维”:
看到这里,公司 CIO 冯总电话进来:“老凡,我最近正在学习 AIOps 运维思想,你过来咱们深入研究下,看怎么能为我们所用啊!”
老凡放下电话,感叹:真是英雄所见略同!
运维进化三部曲
目前,运维工具已经从早期的阈值指标化运维(就是通常说的配置监控项),发展到基于规则的运维,继而进化到现在,以 AIOps 为主的智能化运维,与传统运维手段相比, AIOps 带来了哪些改变呢?
领取专属 10元无门槛券
私享最新 技术干货