History
今天去金山网络面试的时候,被问到性能优化,我说了几个。最后说到了CDN,我说要尽量把静态的内容放置到CDN,可是为什么呢?面试官说既然你说到CDN。你就说说它的原理。
之前有看过,可是忘记差点儿相同了。
Summary
按我个人理解来说它是遵循就近原则,给用户找到近期的server来提供用户的静态内容,比方CSS文件、图像等,来提高用户訪问站点的响应速度。
A content delivery network (CDN) is a system of distributed servers (network) that deliver webpages and other Web content to a user based on the
geographic locations of the user, the origin of the webpage and a content delivery server.This service is effective in speeding the delivery of content of websites with high traffic and websites that have global reach. The closer the CDN server is to the user
geographically, the faster the content will be delivered to the user. CDNs also provide protection from large surges in traffic.
上面说了内容分发网络是基于用户的地理位置、网页的源地址还有就是一个内容分发server。距离CDNserver越近的用户。就能越快地获取到静态内容
description
有比較才有感觉到差别!
- 1 传统訪问页面方式
- 在这篇文章What really happens when you navigate to
a URL中,已经非常清楚告诉我们页面到底是怎样在server和client之间传送的。简单来说就是:
- (1) 用户提交域名
- (2) 浏览器对域名解析,找不到对于的IP。再到操作系统,还是没有;再到路由器。再没有就到DNSserver找
- (3) 最后找到相应的IP地址,向域名的服务主机发出数据訪问请求
- (4) server就返回页面的内容给client
- 可是在这里的问题就是假设訪问量非常大的站点的话。比方新浪微博、facebook等大型站点,这样子的server肯定会被挤爆了,那怎么办呢?缓冲或者说是存储这样的理念在冯·诺依曼提出之后就特别流行。确实。CDN也是採用缓存的理念
- 2 CDN缓存后的站点的訪问过程
- (1) 用户向浏览器提供要訪问的域名;
- (2) 浏览器调用域名解析库对域名进行解析得到CNAME,再解析CNAME域名获取IP地址。在此过程中,使用的全局负载均衡DNS解析,如依据地理位置信息解析相应的IP地址,使得用户能就近訪问;
- (3) 这次解析到仅仅是CDNserver的IP地址。浏览器获取这个IP地址就向CDN缓存发送请求;
- (4) CDN缓存server依据浏览器提供的要訪问的域名,通过Cache内部专用DNS解析得到此域名的实际IP地址。再由缓存server向此实际IP地址提交訪问请求,缓存server就好像是中间人那样子;
- (5) CDN缓存server获取内容后,一方面在本地存储,以便client下次訪问。另外一方面就发送给client;
- (6) client就把从CDN缓存server返回的内容显示,下次訪问就直接訪问CDN缓存server。
- 事实上从上面就好像我们的计算机要訪问数据那样子,由于CPU的运算能力非常快。快到内存根本跟不上。
假设CPU每次运算一下就要去内存获取数据的话,那么计算机的效率太低了。
这样子的话。我们设置缓存。可以缓冲两者速度不匹配而导致的效率问题。所以CPU要訪问数据。先到缓存中找,找不到就去内存中找,然后在缓存中加入相应的数据。下次要訪问改数据就直接到缓存中找即可了。