本文转自 菜鸟教程
一、HTTP协议(HyperText Transfer Protocol,超文本传输协议)
是因特网上应用最为广泛的一种网络传输协议,
是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。
所有的WWW文件都必须遵守这个标准。
HTTP 是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。
二、HTTP工作原理
1. HTTP 协议工作于 客户端-服务端 架构上。浏览器作为 HTTP 客户端通过 URL 向 HTTP 服务端即 WEB 服务器发送所有请求。
2. Web 服务器根据接收到的请求后,向客户端发送响应信息。
HTTP 注意事项:
- HTTP 是无连接:无连接的含义是 限制每次连接只处理一个请求。
服务器处理完客户的请求,并收到客户的应答后,即断开连接。
采用这种方式可以节省传输时间。
- HTTP 是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过 HTTP 发送。
客户端以及服务器指定使用适合的 MIME-type 内容类型。
- HTTP 是无状态:HTTP 协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。
缺少状态 意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。
另一方面,在服务器不需要先前信息时它的应答就较快。
- Web 服务器有:Apache 服务器,IIS 服务器(Internet Information Services)等。
- HTTP 默认端口号为 80,但是你也可以改为 8080 或者其他端口。
三、HTTP协议通信流程
四、HTTP消息结构
HTTP 是基于客户端/服务端(C/S)的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。
一个 HTTP "客户端" 是一个应用程序(Web 浏览器或其他任何客户端)
通过连接到服务器达到向服务器发送一个或多个 HTTP 的请求的目的。
一个 HTTP "服务器" 同样也是一个应用程序(通常是一个 Web 服务,如 Apache Web 服务器或 IIS 服务器等)
通过接收客户端的请求并向客户端发送 HTTP 响应数据。
HTTP 使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。
一旦建立连接后,数据消息就通过类似 Internet 邮件所使用的格式 [RFC5322] 和 多用途 Internet 邮件扩展(MIME)[RFC2045] 来传送。
1. 客户端请求消息
客户端发送一个 HTTP 请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,
下图给出了请求报文的一般格式。
2. 服务器响应消息
HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。
下图给出了响应报文的一般格式。
3. 实例
典型的使用GET来传递数据的实例:
客户端请求:
GET /hello.txt HTTP/1.1
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3
Host: www.example.com
Accept-Language: en, mi
服务端响应:
HTTP/1.1 200 OK
Date: Mon, 27 Jul 2009 12:28:53 GMT
Server: Apache
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
ETag: "34aa387-d-1568eb00"
Accept-Ranges: bytes
Content-Length: 51
Vary: Accept-Encoding
Content-Type: text/plain
输出结果:
Hello World! My payload includes a trailing CRLF.