我有一个实例,它总是让我头疼的系统状态检查失败,我必须重新启动实例才能让它再次运行。我看到有一个create status check alarm选项,我按设置通过电子邮件+ sns收到了通知,但实例没有重启,我必须进入ec2仪表板才能手动重启如果我没有正确设置任何设置,或者如果有人有其他想法,如果状态检查失败,我如何自动重启实例?
我正在运行负载均衡,将传入的请求分派到两个CPE实例。 它在某些天运行得很好,在另一些天,实例在没有明显原因的情况下被重启,所以所有的进程(主要是tomcat)都被终止了,用户收到了错误。我没有运行可抢占的VM实例(我已经根据Why do my google cloud compute instances always unexpectedly restart?进行了检查) 如何找出实例重启的原因?这种经历变得越来越令人沮丧。在切换到GCP之前,我曾经运行过一组廉价的托