面试题:作为linux运维,客户反映打开你的网络服务器很慢,如何排错(运维)?
(一)用户个例,还是全部
自己把自己当做用户去测试。如果没问题,就从客户的角度去思考,如果自己测试同样有问题,按照下面思路排查。
1.路是否通的问题
a. ping www.baidu.com高速路有没有修好
如果ping是通的,不丢包。http服务器的问题(服务宕机了,服务过载了)
如果ping是通的,丢包,机房带宽不稳定,各个线路不稳定。
如果ping不通,ping qq.com 机房宕了,或者http服务的问题(服务宕机,服务过载了)
b.tracert -d www.baidu.com 高速的各个路段有没有修好,从客户端到服务器之间各个线路,让机房配合检查。
2.机房业务是否OK
c.telnet www.baidu.com 80检查服务器WEB服务有没有开启以及防火墙有没有挡住。
nmap www.baidu.com -p 80
curl www.baidu.com 或者wget www.baidu.com相当于浏览器访问。
d.提供服务的服务器是否资源过载,服务器及服务连接数过多,负载高,cpu高,IO高。
3.外部问题
e.网站购买的带宽满了,通过流量监控服务查看。
f.内链外链(调用外部网站网址有问题)
必不可少的重要调试网站前端的工具
根据网站URL调试网站
-
google浏览器直接F12
-
2.过户firebug,yslow
-
ie httpwatch
4.其他问题
个别客户自身问题,例如:运营商线路和网站带宽的线路不符。
5.集群架构(数摆台服务器提供服务)
g.WEb服务问题。
h. 数据库问题,登录数据库,看是否有慢查询语句show proceslist ,调整MYSQL,优化SQL语句。
i.存储等的问题,是不是存储服务器,如NFS,MFS的负载及磁盘IO高?
更改更复杂的网络环境的排查方法,架构师再讲。
本文转自sandshell博客51CTO博客,原文链接http://blog.51cto.com/sandshell/1949116如需转载请自行联系原作者
sandshell