首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

线上巡检机制

在上个文章中探讨了微服务架构中规模化产品的集群化的验证方式,这样的目的是可以实现针对服务可持续的验证。微服务架构它的特点之一是服务太多,很难保障所有的服务都是可用的,有可能出现这样的一个情况就是晚上上线的时候,产品的各个业务形态都是正常的,但是到第二天的时候,某个服务由于某些问题导致服务不可用然后影响到具体的业务形态,从而影响到客户的使用,接着而来的就是各种复盘以及问题的追究,这种是最让人头疼的。也会让业务交付的团队承担不应该属于自己的问题。那么这就涉及一个很核心的问题,这问题到底是谁的责任了?总不能让运维去承担吧。

01
您找到你想要的搜索结果了吗?
是的
没有找到

国内首个《中国混沌工程调查报告》深度解读来了!(附下载链接)

随着分布式、云原生成为主流的系统架构设计方案,大规模分布式系统的稳定性保障能力越来越成为业界关注的重点。如今,混沌工程作为保障系统稳定性的利器,受到业界广泛关注,中国信通院作为国内最早推进混沌工程标准化工作的单位,联合混沌工程实验室全体成员单位、社区、媒体共同发起国内首个混沌工程问卷调查,以期掌握我国混沌工程的接纳程度和特点。   本报告采用在线调查加线下访谈的方式,共回收有效问卷 1016 份、访谈企业 17 家。报告的第一部分介绍调查背景,第二部分介绍我国混沌工程当前使用情况,第三部分是混沌工程致力于提

02

云原生混沌工程 - 增强Kubernetes应用容错性

不管在将软件投入生产之前进行多么困难的测试以发现错误,错误总是会发生 - 云和可用区域会出现问题,网络会崩溃,是的,错误会让人感觉它们的存在。容错性(Resilience/弹性)是指一个系统承受这些错误的能力 - 例如,一个高度容错性的系统,一个由松散耦合的微服务构建的系统,它本身可以很容易地重新启动和扩展,在不影响用户的情况下克服这些错误。混沌工程是在系统出现故障之前,将其注入系统的实践。混沌工程现在被认为是确保当今频繁变化和高度复杂的系统实现所需的容错性的基本方法。通过混沌工程,可以在引起用户问题之前发现和纠正未预料到的故障场景。

01

FreeWheel核心业务团队混沌工程实践之路

近来 FreeWheel 微服务业务团队的业务逐渐扩大,单体服务已经无法胜任,于是我们如火如荼地开展了向微服务迁移的工作,一时间,服务如雨后春笋般冒了出来。在享受微服务带来便利的同时,我们也面临着众多服务带来的整体稳定性的考验。尽管我们有着完善的监控和报警系统,一旦故障发生,总是能第一时间通知到工程师来排查问题,但是这些都是事后的响应和应对。如何能提前了解系统可能会出啥问题,啥时候会出问题,出了问题怎么应对变得至关重要。混沌工程是帮助解决这一问题的不二选择,本文主要聊一下 FreeWheel 微服务业务团队在混沌工程道路上的实践。

02

混沌工程中数据库调用延迟

混沌工程的核心是通过实验的方式来验证系统在稳定下下它的不稳定性,从而通过混沌工程实验的方式来模拟这种情况并给出合理的解决方案,所以它最重要的不是混沌实验,而是实验背后的解决方案。业内最早实践混沌工程的公司是Netfix,混沌工程具体它的定义为:“混沌工程是一门在系统上进行实验的科学,目的是建立系统抵御生产环境中失控情况的能力以及信心”。比如在生产环境中数据库的实例突然瘫痪,云服务器的实例突然消失以及底层服务出现雪崩等等一系列的故障情况下,这个时候整个系统层面需要考虑的是出现这种极端以及很平常的故障下,如何使用技术的手段来保障系统依然能够给客户提供价值从而保障系统的可用性,特别是在分布式架构下服务复杂的调用链以及涉及众多中间件,更加需要考虑在异常的情况下系统的伸缩性和高可用性。

03
领券