默认情况下,zabbix能够检查机器上的进程总数、触发器和错误(如果这些进程超过300个)。
显然,这对更大的机器不起作用。我确实有一个32码的服务器,很明显300个进程对这台机器来说是没有意义的。如果每个CPU的进程数大于300个,我确实希望更改此规则以触发警告。此触发器位于linux模板内,命名为“{HOST.NAME}上的进程太多”,默认值为"{Template OS Linux:p
这是一个基本的linux管理问题。我们有一个运行生产应用程序的CentOS linux机器。该机器上运行着10个特定于应用程序的进程。Once in every 3/4 days, the linux machine freezes和获得它的唯一方法是从Amazon控制台重新启动它。
我们启用了,它每5分钟捕获一次CPU使用情况。我们看到,CPU达到100% (8个核心)在10-15秒内,就在它冻结。不幸的是,我们无法从进程日志文件中找出任何