首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关于数据驱动运维的几点认识

    在一个新的环境中工作了两个多月,从业务模式、平台建设、工作方法和团队工作风格各个方面都有了一些认识。有了这些认识,更能让你体会到工作的发力点在哪里,这次自己的工作方法做了很大的调整,没有去平移过去的工作经验,因为当前的很多预设条件和过去不同(具体就不一一列举)。其实运维工作很多时候都聚焦在两个方面,一个是工具建设;一个是数据建设。在工具平台建设层面上,进一步突破的阻力很大,一则缺乏标准化的基础;其次还在于大家意识的改变。因此这次想从数据分析体系入手,用数据说话,用数据评价运维服务。简而言之,就是数据驱动运维(Data-Driven Ops)。

    01

    3.4 事中故障处理(3)故障定位

    故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。通常大部分可用性故障,要借助运维专家经验的假设判断或已知预案的执行得到解决,但仍有部分故障,尤其是性能、应用逻辑、数据故障需要多方协同与工具支持。故障定位的方法通常包括专家经验驱动的假设尝试、测试复现、预案启动、代码分析四种,这个过程涉及对日志、链路、监控、数据感知、知识管理五类工具。随着系统复杂性不断提升,依靠专家经验驱动的假设尝试准确率会下降,如何将数字化手段结合专家经验,融入到协同机制中,这考验故障定位场景的设计水平。

    02

    Google、顺丰、网易数帆、微盟等技术专家,为你分享稳定性保障实践 | ArchSummit

    架构稳定性保障是指通过一系列的技术手段和方法,保证系统在各种异常情况下能够正常运行,不出现故障或者尽快恢复。架构稳定性保障涉及到多个方面,例如架构设计、容量评估、异常处理、监控报警、故障演练等。一些常见的架构稳定性保障方案包括: 消除单点故障,通过分布式部署、主从备份、服务注册发现等技术手段,避免单个节点或服务的故障导致整个系统不可用; 保证数据一致性,通过事务、分布式事务中间件、消息队列、对账机制等技术手段,确保分布式系统中的数据在不同节点和服务之间保持一致或最终一致; 强弱依赖梳理和降级,通过分析服务之

    02

    天机阁——全链路跟踪系统设计与实现

    小时光茶社 传说中天机阁里有一台掌控世间一切的机器,万物运行由此产生。本文的“天机阁”是一个基于链路跟踪的监控系统,后台开发人员能够通过“天机阁”洞察“天机”,快速解决问题。 摘要 为了支撑日益增长的庞大业务量,业界大量使用微服务架构。服务按照不同的维度进行拆分,互联网应用构建在不同的软件模块集上,这些软件模块可能是由不同的团队开发、可能使用不同的编程语言来实现、可能布在了几千台服务器,横跨多个不同的数据中心,分布式系统变得日趋复杂。 如何快速进行故障定位?如何准确进行容量评估?如何动态展示服务的链路?如

    05

    百万年薪的云原生开发者要掌握哪些“真功夫”?阿里、腾讯、美团、字节联袂解密

    作者 | 杨阳 出品 |《新程序员》编辑部 《新程序员003:云原生和全面数字化实践》(以下简称《新程序员 003》)由CSDN全力打造、50+专家倾力创作,通过“云原生时代的开发者”和“全面数字化转型”两大专题,为开发者呈上最前沿的技术观点与技术大神、顶级大厂的实践心得及理论知识。 点击图片查看《新程序员003》 同时,本书以音视频、图文等丰富形式为载体,“电子书+纸质书”同步发行,满足读者各类场景的视听需求。 提到云原生,除了“百万年薪”,还有“不明觉厉”。 云原生有没有统一概念呢?当然有。它的提

    02

    Devops微服务架构下具有代码级穿透能力的精准测试

    微服务是Devops场景下热门的开发框架,在大型项目中被广泛采用。它把一个大型的单个应用程序和服务拆分为数十个的支持微服务,独立部署、互相隔离,通过扩展组件来处理功能瓶颈问题,比传统的应用程序更能有效利用计算资源。微服务之间无需关心对方的模型,它通过事先约定好的接口进行数据流转,使业务可以高效响应市场变化。但微服务一个明显的表象就是随着服务的增多,传统的测试模式受到很大制约,无法有效进行下去,威胁到整体系统质量。所有J2EE代码层白盒采集工具都无法区分覆盖和具体功能的对应关系,只能以后台模式“笼统“的采集一个阶段的总的覆盖,无法满足对于Devops下对于故障定位、深度测试分析以及敏捷发布算法的要求。   星云测试(www.teststars.cc)发布分布式微服务精准测试解决方案,是目前市场上唯一可达到在复杂分布式系统中,跨多个服务器进行代码白盒级分析、实现请求分布式追踪的测试平台。其中产品内的穿透模块,可以支持各种主流微服务通信架构。例如httpclient,springcloud微服务架构、阿里dubbo微服务架构,以及消息队列,将并发访问场景下跨多个服务多组代码逻辑分离并重建追踪出来。实现业务逻辑的代码在开发层面通过微服务离散后,在测试阶段则可以反向复原整个完整代码执行视图。精准测试里面的穿线概念(Threadingtest)增加了第三层含义,即针对的分布式服务的穿透能力。

    03

    中国工商银行基于eBPF技术的云原生可观测图谱探索与实践

    作者 | 中国工商银行金融科技研究院   在互联网金融时代,各大银行业务量呈爆发性增长态势,业务模式更新迭代更加频繁,传统的 IT 架构越来越无法应对新业务形态所带来的巨大冲击与挑战。云原生相关技术使业务应用呈现微服务众多、多语言开发、多通信协议等典型特征,调用链路日益复杂,监控数据爆发性增长,传统监控方式已无法适应云原生场景。 在这个背景下,中国工商银行积极开展云原生可观测图谱的探索和实践,针对可观测体系中的痛难点,通过深入研究内核新技术,进一步完善云原生技术版图。 1 业界云原生可观测体系痛点 中国

    01
    领券