首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

侦探养成技:如何追溯分析一个线上缺陷

前言 对于数学问题,自己想出答案和确认别人的答案是否正确,哪一个更简单,或者困难到何种程度。拟一个别人无法解答的问题和解开那个问题,何者更困难?——东野圭吾 《嫌疑人X的献身》 前段时间看了一部小说,印象中最深刻的就是上面的这句话。百年一遇的数学天才石神,在暗恋的邻居靖子错手杀了前夫后,布了一个匪夷所思的局,让警方一直陷入迷局无法破案。当时看完的感悟就是“有时你以为的正确答案,其实也会欺骗你。” 一直觉得作为测试人员,在追溯分析线上的用户反馈的问题的时候,跟侦探破案有异曲同工之妙——都需要分析案情现场(定位

09

为自己的服务负责--高可用、高性能、安全服务的一些想法

每个后台开发人员都可以问一下自己下面的几个问题 1,我的服务当前QPS是多少?最大是多少?以当前用户增长速度多久之后需要扩容? 2,我的服务每个接口耗时多少毫秒?时间耗在什么地方了?是否有优化的余地,如果没有,为什么? 3,我的服务瓶颈在哪儿?CPU,网络,磁盘IO,内存? 4,我的服务安全吗? 输入参数会不会被篡改?会不会被重放攻击?DNS会不会被劫持? 5,我的服务高可用吗?会不会雪崩?是不是柔性可用? 6,我的服务有容灾功能吗?地震了,战争了,市政工程把光缆挖断了(不要笑,微信就遇到过)? 我觉得只有对自己的服务了如指掌,晚上才能踏实地睡觉,不必担心半夜爬起来oncall。

04

system表空间不足的问题分析(r6笔记第66天)

很多事情见多了也就有了麻木的感觉,报警短信就是如此,每天总能收到不少的报警短信,可能很多时候就扫一眼,如果没有严重的问题自己是不会情愿打开电脑处理的。 对于此,有些朋友说是不是阀值太低了,调高一些报警就少了,如果那样做,监控的意义也就大大不同了。很多时候硬件错误或者系统错误不是突然出现问题,而是在一些异常的情况下运行,时间长了,难免出错,打个比方,如果两个配置一模一样的系统,一个内核参数有问题,资源使用有异常,总是CPU满负荷空跑,产生了大量的IO浪费,而另外一台,就是真正的空闲,负载不高,各项指标正常,那

04
领券