智能巡检支持基于集群、节点、索引等维度对腾讯云 Elasticsearch(ES)集群进行健康检测,能够主动排查集群问题和隐患,并基于腾讯云专家经验沉淀给出问题解决方案,自动归纳集群巡检结果生成报告。智能巡检服务能够为用户提取集群关键信息、高效定位集群问题、提供专业解决建议,实现运维体验闭环。
功能概述
查看巡检概览
查看集群巡检健康概况和趋势变化。
集群巡检
支持选择需要巡检的索引和巡检项,支持自动巡检和手动巡检集群,并产生巡检报告。
查看巡检报告
支持查看最近一个月的历史巡检报告,报告中包含巡检项说明、巡检结果、巡检建议、详情。
关闭智能巡检
开启智能巡检
智能巡检需要访问用户集群的基本信息和日志,因此当首次启用智能巡检服务时,需要用户对访问授权。
操作步骤
1. 登录 ES 控制台,在集群列表中单击需要开启智能巡检的实例 ID/名称,进入实例详情页。
2. 在实例详情页,切换到智能巡检页签,界面内展示智能巡检功能的初始化页面。
3. 在初始化页面中,可单击《集群操作授权说明》,阅读相关说明和提示事项。
4. 确认无误后,勾选我已阅读并充分理解《集群操作授权说明》。然后单击授权开启智能巡检服务,即可开启智能巡检功能。
查看巡检概览
巡检概览统计并展示了集群的巡检结果及其趋势变化,方便用户查看集群近期的健康状况。巡检结果通过高风险、低风险和安全3种状态来展示集群的健康状况:
高风险:表示集群已经出现了严重的问题或隐患,已经影响集群可用性,需要立即处理,否则会导致数据丢失、集群故障等问题。
低风险:表示集群存在较严重的问题或隐患,可能会影响集群可用性,建议尽快处理。
安全:表示集群健康。
操作步骤
1. 登录 ES 控制台,在集群列表中单击实例 ID/名称(实例已开启智能巡检),进入实例详情页。
2. 在实例详情页,切换到智能巡检页签,在巡检概览部分,展示了最新集群巡检结果、巡检项趋势和近7天巡检结果累计分布。
最新集群巡检结果:会展示最近一次的集群巡检结果。
巡检项趋势:展示最近7天内每天最后一次巡检的巡检项健康状态。
近7天巡检结果累计分布:展示最近7天内全部巡检次数累计的巡检结果,帮助您判断巡检项的健康状况。
巡检集群
开启智能巡检功能后,支持巡检集群,并产生巡检报告。支持自动巡检和手动巡检,用户可选择需要巡检的索引和巡检项。每次巡检约耗时2分钟。
自动巡检:系统将随机生成一个固定巡检时间,每天在该时间点定时巡检集群,默认选择全部巡检项并生成巡检报告,每天一次,支持更改巡检时间。
手动巡检:除了每天的自动巡检外,支持手动随时触发巡检任务,用户可以指定部分巡检项和索引,并立即生成巡检报告,每天限制5次。
操作步骤
1. 登录 ES 控制台,在集群列表中单击实例 ID/名称(实例已开启智能巡检),进入实例详情页。
2. 在实例详情页,切换到智能巡检页签。
3. 在“智能巡检”页的集群巡检中选择巡检索引和巡检项。系统默认选择所有巡检索引和所有巡检项,用户也可自定义选择,支持通过正则表达式选择巡检索引。选择完成后,单击手动巡检。
4. 诊断完成后,系统会展示最新的智能巡检报告。查看智能巡检报告,获取集群的最新状况,包括巡检项说明、巡检结果和巡检建议。
查看巡检报告
巡检报告中包含巡检项说明、巡检结果、巡检建议以及详情,报告内容由用户选择的巡检项构成。最多支持查看最近一个月的历史巡检报告。
操作步骤
1. 登录 ES 控制台,在集群列表中单击实例 ID/名称(实例已开启智能巡检且至少已生成一份报告),进入实例详情页。
2. 在实例详情页,切换到智能巡检页签。
3. 在“智能巡检”页的巡检报告中,可单击右侧目录查看不同日期下的历史报告,在左侧查看对应的历史报告详情。
关闭智能巡检
当用户不再需要使用智能巡检功能时,可关闭该服务,关闭后,系统将不会再定时巡检集群并生成新的巡检报告。关闭后再开启,系统将保留开启日期前30天的历史巡检报告。
操作步骤
1. 登录 ES 控制台,在集群列表中单击实例 ID/名称(实例已开启智能巡检),进入实例详情页。
2. 在实例详情页,切换到智能巡检页签,单击关闭智能巡检。
3. 在关闭智能巡检中,阅读注意事项,确认无误后,单击确定即可关闭智能巡检。