本节书摘来自异步社区《CCNP TSHOOT 300-135学习指南》一书中的第2章,第2.2节排障案例:基于结构化故障检测与排除方法和进程,作者【加】Amir Ranjbar(阿米尔 兰吉巴),更多章节内容可以访问云栖社区“异步社区”公众号查看
2.2 排障案例:基于结构化故障检测与排除方法和进程
CCNP TSHOOT 300-135学习指南
Armando是AMIRACAN公司的网络支持人员,有一天收到公司财会部门Ariana的故障报告。Ariana抱怨其办公电脑无法访问Internet,她正试图访问www.cisco.com。此时虽然收到了故障报告,但是还没有真正开展故障检测与排除进程。Armando将遵循结构化故障检测与排除流程,一步步地解决故障并记录整个排障过程。
定义故障:Armando决定前往Ariana的办公室验证故障问题,去了之后发现Ariana昨天还能访问www.cisco.com。Armando在系统中创建了一个故障工单,准确定义了Ariana上报的故障问题以及发生的时间,指出已经验证了故障问题,并且24小时之前还不存在该故障。
收集信息:Armando决定从自己办公室的工作站访问www.cisco.com,发现完全正常。根据收集到的信息,Armando决定采用自底而上法,在Ariana的办公室使用其工作站开始检测与排除故障。使用其工作站的过程中,Armando发现工作站拥有IP地址、子网掩码、默认网关和DNS服务器地址,Armando向已配置的DNS服务器地址发起ping测试,发现ping测试100%成功。但是,由于无法从Ariana的工作站访问网页,因而Armando决定利用nslookup来查看DNS服务器是否能够为已知的URL返回正确的IP地址。发现已配置的DNS服务器地址无法完成域名解析任务,因而Armando将Ariana工作站配置的DNS地址与财会部门其他工作站进行对比,发现Ariana工作站的配置与其他工作站的配置均不相同。
分析信息:目前已经知道Ariana的工作站是财会部门唯一一台无法通过域名访问网页的工作站,而且她的工作站的DNS服务器地址与其他同事均不相同,且该DNS服务器不响应nslookup,因而Armando认为Ariana的故障问题与已配置的DNS服务器有关。查阅了与用户工作站相关的网络文档后,Armando发现应该由DHCP服务器为用户工作站分配DNS服务器地址。
排除潜在故障原因:Armando断定物理层和数据链路层没有故障。
提出推断:Armando怀疑Ariana的IP编址信息全部都是手工配置的,或者基本的IP编址信息是通过DHCP获得的,但DNS服务器地址等信息则是手工输入的(而且输入有误)。Armando推断最可能的故障原因就是手工输入的DNS地址无效(且错误)。
验证推断:Armando修改Ariana工作站的配置,让工作站通过DHCP获取DNS服务器地址,然后尝试访问www.cisco.com以验证修正结果,发现可以访问该网站。
解决故障并记录排障过程:Armando在系统中记录该故障工单的解决方案并关闭故障工单,然后向Ariana解释不能手工输入DNS服务器的IP地址的原因,而且利用已知的第三方DNS服务器还会带来严重的安全威胁。最后,Armando在故障工单的网络文档中建议,不应该授权用户账户更改系统设置。