node-problem-detector
的作用是收集k8s集群管理中节点问题,并将其报告给apiserver。它是在每个节点上运行的守护程序。node-problem-detector可以作为DaemonSet运行,也可以独立运行。当前,GCE集群中默认开启此扩展。
项目地址: https://github.com/kubernetes/node-problem-detector
为了解决这个问题,我们引入了这个新的守护进程node-problem-detector
,从各个守护进程收集节点问题,并使它们对上游层可见。一旦上游层面发现了这些问题,我们就可以讨论补救措施。
node-problem-detector
的问题检测类型 当前支持的问题检测类型:
node-problem-detector
使用Event和NodeCondition将问题报告给apiserver。
--version:显示当前版本。 --hostname-override:用于node-problem-detector的自定义节点名称,用于更新condition并发出event。node-problem-detector首先从hostname-override获取节点名称,然后从NODE_NAME环境变量获取节点名称,最后从os.Hostname返回。
--exporter.stackdriver:Stackdriver exporter程序配置文件的路径,例如 config/exporter/stackdriver-exporter.json,默认为空字符串。设置为空字符串以禁用。
访问个人网站,获取更多内容: https://www.aiopsclub.com/
- END -