几个人靠对日志去看,同一秒多次请求很正常,而且每个服务器的时间有可能不一样。也没有requestId之类的东西,让你确定是同一个请求。请求到底真正发出去没有,也是个问题。这个时候显得日志很重要,打印好日志很重要,尤其是跨系统排查问题显的更加重要。
解决问题不能靠猜,需要有上下文,别人说的上下文就一定是上下文吗?你确定这个请求就是报错的请求吗?如果不能确定,就先不要猜,也不要出那些所谓的解决方案。
这里再整理系统异常处理的原则和处理规范,应该注意的事项:
一个错误描述的基本信息应该包含:
没有具体的根据去分析问题,找出问题算侥幸。大家都知道记叙文三要素是时间、地点、人物。以及六要素包括时间、地点、人物、(事件的)起因、经过和结果。当出现问题的时候,通过异常处理,把我们需要的关键信息描述清楚这样的异常处理才有价值。好像看似有些系统有异常处理,好像跟没有差别不大。减少技术支持时间,减少排查问题的时间才是好的异常处理。
精进自省:我生来就是高山而非溪流 ,我欲于群峰之巅俯视平庸的沟壑。我生来就是人杰而非草芥,我站在伟人之肩藐视卑微的懦夫。