与HTTP有关的应用技术:
1.互联网上绝大部分资源都使用 HTTP 协议传输;
万维网(World Wide Web)是互联网的子集,基于 HTTP 协议,传输 HTML 等超文本资源。万维网之外的资源,例如常用的电子邮件、BT 和 Magnet 点对点下载、FTP 文件下载、SSH 安全登录、各种即时通信服务等等,它们需要用各自的专有协议来访问,但由于HTTP超文本的表述能力强,很多这些资源可以“包装”成 HTTP 来访问(网页版邮箱)。现在的互联网 90% 以上的部分都被万维网,也就是 HTTP 所覆盖。
2.浏览器是 HTTP 协议里的请求方,即 User Agent;
3.服务器是 HTTP 协议里的应答方,常用的有 Apache 和 Nginx;
硬件含义就是物理形式或“云”形式的机器。
软件含义的 Web 服务器,就是提供 Web 服务的应用程序,通常会运行在硬件含义的服务器上。Apache (老牌,资源多,学习门槛低)和 Nginx(后起之秀,高性能,高稳定)
4.CDN 位于浏览器和服务器之间,主要起到缓存加速的作用;
除了基本的网络加速外,还提供负载均衡、安全防护、边缘计算、跨运营商网络等功能。
5.爬虫是另一类 User Agent,是自动访问网络资源的程序。
与HTTP有关的协议/概念:
1、四层模型:应用层、传输层、网络层、链接层
2、IP协议主要解决寻址和路由问题
3、ipv4,地址是四个用“.”分隔的数字,总数有2^32个,大约42亿个可以分配的地址
4、ipv6,地址是八个用“:”分隔的数字,总数有2^128个。
5、TCP协议位于IP协议之上,基于IP协议提供可靠的(数据不丢失)、字节流(数据完整)形式的通信,是HTTP协议得以实现的基础
6、域名系统:为了更好的标记不同国家或组织的主机,域名被设计成了一个有层次的结构。“域名系统”(Domain Name System),域名又称为主机名。
7、域名用“.”分隔成多个单词,级别从左到右逐级升高。
8、域名解析:将域名做一个转换,映射到它的真实IP
9、URI:统一资源标识符;URL:统一资源定位符
URL是URI的一个子集,实际上两者几乎等同,不必刻意区分。(URN
10、URI主要有三个基本部分构成:协议名、主机名、路径
URI 是统一资源标识符,标定了客户端需要访问的资源所处的位置,如果URI中的主机名使用域名,则需要使用DNS来把域名解析为IP。
11、HTTPS:运行在SSL/TLS协议上的HTTP
12 、SSL/TLS:建立在TCP/IP之上的负责加密通信的安全协议,是可靠的传输协议,可以被用作HTTP的下层
SSL 的全称是“Secure Socket Layer”,由网景公司发明,当发展到 3.0 时被标准化,改名为 TLS,即“Transport Layer Security”,但由于历史的原因还是有很多人称之为 SSL/TLS,或者直接简称为 SSL。
13、代理(Proxy):是HTTP协议中请求方和应答方中间的一个环节。既可以转发客户端的请求,也可以转发服务器的应答。(CDN就是其中一种
代理的功能:
负载均衡:把访问请求均匀分散到多台机器,实现访问集群化;
内容缓存:暂存上下行的数据,减轻后端的压力;
安全防护:隐匿 IP, 使用 WAF 等工具抵御网络攻击,保护被代理的机器;
数据处理:提供压缩、加密等额外的功能。
14、代理常见种类:匿名代理(外界只看到代理服务器(中转站))、透明代理、正向代理(代表客户端->服务器)、反向代理
15、代理可以做的事:负载均衡、内容缓存、安全防护、数据处理。