一.机制分析
根据代码逻辑,分析问题产生的各个职责链。严格分析和排查每条职责链的每个步骤。通过搜集可疑步骤的代码、日志等信息,进行问题确认。
二.黑盒重现
搜集与问题业务相关的配置、现象集合,将问题数据集合,与无问题的数据集合的配置、现象进行比较,归纳出问题的规律,推测出可能造成问题的因素。
三.增加反馈
1.增加日志,增加反馈
2.对系统加入新的影响,观察问题的变化
四.历史分析
1.根据问题出现的时间,和相关时间前后的操作,确定是否有某种操作(比如升级,配置数据刷新等)造成问题
1.增加日志,增加反馈
2.对系统加入新的影响,观察问题的变化
四.历史分析
1.根据问题出现的时间,和相关时间前后的操作,确定是否有某种操作(比如升级,配置数据刷新等)造成问题
2.如果问题在一段时间中有变化,那么归纳变化的趋势。了解这段时间在环境上的变动,查看变动前后问题是否有突变。
五.环境检查
全面分析环境中所有信息(包括各个进程日志),可能发现在上述分析过程中漏掉的场景。也可能发现其他问题,排除后能够减少当前问题。
六.回避问题
1.改变易造成问题的方案架构,从而避免问题。
2.增加脚本,问题发生后快速矫正数据。
3.在代码中,直接判断输出结果,如果是有问题的,修改掉再输出。