
微服务架构场景中,应用系统复杂切分散。长期运行时,局部出现故障时不可避免的。如果发生故障时不能进行有效反应,系统的可用性将极大地降低。
故障演练是指模拟生产环境中可能出现的故障,测试系统或应用在面对故障时的反应和响应能力。
故障演练可以模拟各种故障情况(网络故障、数据库故障、服务过载,CPU或内存异常等)。
故障演练是微服务架构下非常重要的实践,用以测试系统或应用在面对故障或缺陷时的反应表现及其恢复能力。
通过故障演练,至少可以在以下几方面获得收益:
故障演练的目标是尽可能模拟真实世界中的故障情况,战略性推动全面和深入的风险管理与测试。
故障演练大致可以分为:计划、演练、评价、改进四个阶段,其基本流程如下图所示。


以下是云原生、微服务场景下常用的故障演练工具:
故障演练通常可以按照面的流程和步骤来进行:
