本文希望通过一篇文章解决所有域名解析中相关的问题
Linux下域名解析流程
- DNS域名解析的时候先根据 /etc/nsswitch.conf 配置的顺序进行dns解析(name service switch),一般是这样配置:hosts: files dns 【files代表 /etc/hosts ; dns 代表 /etc/resolv.conf】(ping是这个流程,但是nslookup和dig不是)
- 如果本地有DNS Client Cache,先走Cache查询,所以有时候看不到DNS网络包。Linux下nscd可以做这个cache,Windows下有 ipconfig /displaydns ipconfig /flushdns
- 如果 /etc/resolv.conf 中配置了多个nameserver,默认使用第一个,只有第一个失败【如53端口不响应、查不到域名后再用后面的nameserver顶上】
Linux下域名解析流程需要注意的地方
- 如果 /etc/resolv.conf 中配置了rotate,那么多个nameserver轮流使用. 但是因为底层库的原因用了rotate 会触发nameserver排序的时候第二个总是排在第一位
- 如果被解析的域名不是以 "." 结尾,那么解释失败后还会尝试resolv.conf中search追加到后面,resolv.conf最多支持6个search域
- ping调用的是glibc的 gethostbyname() 函数流程--背后是NameServiceSwitch,nslookup不是.所以你会经常看到其中一个可以另一个不可以,那么就要按第一部分讲解的流程来排查了。
Linux下域名解析诊断工具
- ping
- nslookup (nslookup domain @dns-server-ip)
- dig (dig +trace domain)
- tcpdump (tcpdump -i eth0 host server-ip and port 53 and udp)
- strace
微服务下的域名解析、负载均衡
微服务中多个服务之间一般都是通过一个vip或者域名之类的来做服务发现和负载均衡、弹性伸缩,所以这里也需要域名解析(一个微服务申请一个域名)
域名解析通过jar、lib包
基本与上面的逻辑没什么关系,jar包会去通过特定的协议联系server,解析出域名对应的多个ip、机房、权重等
域名解析通过dns server
跟前面介绍逻辑一致,一般是/etc/resolv.conf中配置的第一个nameserver负责解析微服务的域名,解析不到的(如baidu.com)再转发给上一级通用的dns server,解析到了说明是微服务自定义的域名,就可以返回来了
如果这种情况下/etc/resolv.conf中配置的第一个nameserver是127.0.0.1,意味着本地跑了一个dns server, 这个服务使用dns协议监听本地udp 53端口
验证方式: nslookup 域名 @127.0.0.1 看看能否解析到你想要的地址
kubernetes 和 docker中的域名解析
一般是通过iptables配置转发规则来实现,这种用iptables和tcpdump基本都可以看清楚。如果是集群内部的话可以通过CoreDNS来实现,通过K8S动态向CoreDNS增删域名,增删ip,所以这种域名肯定只能在k8s集群内部使用