http的body
数据类型和编码
HTTP协议为什么要关心 body
- TCP/IP 协议栈,传输数据基本格式:header+body。
- TCP、UDP是传输层协议,不关心body数据是什么,只要把数据发送给对方就算完成了任务。
- HTTP 协议是应用层协议,数据到达只能说工作完成了一半,还需要告诉上层应用,这是什么数据,否则上层应用不知所措。
MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型
- MIME 用在电子邮件中,可以让电子邮件发送ASCII 码以外的任意数据,给数据定义了一个标准规范。
- MIME 把数据分为8大类,每个大类下再细分多个子类,形式为“type/subtype”的字符串,纳入到了HTTP头字段里。
- HTTP 使用了其中一部分,用来标记 body 的数据类型,即 MIME type。
HTTP 常用数据类型 MIME type
- text
- 文本格式的可读数据
- text/html 表示超文本文档;text/plain 纯文本;text/css 样式表
- image
- 图像文件
- image/gif;image/jpge; image/png
- audio/video
- 音频和视频数据
- audio/mpeg;video/mp4
- application
- 数据格式不固定,可能是文本也可能是二进制,必须由上层应用程序来解释。
- application/json;application/javascript;application/pdf
- application/octetstream 不透明的二进制数据
HTTP 常用的编码格式 Encoding type
- HTTP 在传输时为了节约带宽,有时还会压缩数据,为了不要让浏览器继续猜,还需要一个Encoding type,告诉数据用什么编码格式,这样对方才能正确解压缩,还原出原始数据。
- 常用的Encoding type
- gzip:GNU zip 压缩格式,最流行
- deflate:zlib 压缩格式,也流行
- br:一种专门为HTTP优化的新压缩算法
数据类型使用的头字段
有了MIME type和Encoding type,无论是浏览器还是服务器都可以很轻松识别出body的类型,这样就能正确处理数据了。
为了客户端和浏览器的“内容协商”,HTTP协议定义了两个 Accept 请求头字段和两个 Content 实体头字段。
客户端用Accept 头告诉服务器希望接收到什么样的数据;服务器用 Content头告诉客户端实际发送了什么样的数据。
举例:
Request Headers:
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Response Hraders:
Content-Length: 718
Content-Type: text/plain; charset=UTF-8
语言类型和编码
- 为了解决body 的语言“国际化”的问题,引入【语言类型和字符集】的概念。
- 语言类型:type-subtyoe,如英语,汉语,日语等
- en 任意英语
- en-US 美式英语
- en-GB 英式英语
- zh-CN 汉语
- 字符集:charset,如 ASCII,GBK,UTF-8 等
- 语言类型使用的头字段
Accept-Language: zh-CN,zh;q=0.9
Content-Language:zh-CN
- 字符集在HTTP中使用的头字段是 Accept-Charset ,但是响应头却没有对应的Content-Charset,而是在 Content-Type 字段的数据类型后面用 charset=xxx 表示。
内容协商的质量值
- HTTP协议里用 Accept、Accept-Encoding、Accept-Language 等请求头字段进行内容协商的时候,还可以用一种特殊的“q”参数表示权重来设定优先级。
- “q”的含义,“quality factor”。
- 权重的取值:
- 最大 1;最小 0.01;默认值为1,0表示拒绝
- 表示:; q=0.01
- 举例:Accept:text/html,application/xml;q=0.9,/;q=0.8
- 它表示浏览器最希望使用的是 HTML文件,权重是1
- 其次是 xml 文件,权重是 0.9
- 最后是任意数据类型,权重是 0.8
- 服务器收到请求头后,就会计算权重,再根据自己的实际情况优先输入 HTML 或 XML。
内容协商的结果
- 内容协商的过程是不透明的,每个web服务器使用的算法都不一样
- 有时服务器会在响应头多加一个 Vary 字段,记录服务器在内容协商时参考的请求字段,给出一些信息。
- 举例:Vary:Accept-Encoding,User-Agent,Accept
- 表示:服务器依据上面三个字段,然后决定了发回的响应报文。