URI:Uniform Resource Identifier
URL: Uniform Resource Locator,用于描述某服务器某特定资源的位置
URN: Uniform Resource Nameing
基本语法: <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag> scheme:url方案 <user>:<password> : 用户名密码 <host>:<port> : 服务器地址 <path> : 资源路径 params: 参数 http://www.magedu.com/bbs/hello;gender=f query: http://www.magedu.com/bbs/item.php?username=tom&title=ab frag: # ....
一次完整的http请求过程
1. 建立或处理连接: 接收请求或拒绝请求 2. 接收请求 接收来自于网络的请求报文中对某资源的一次请求的过程 并发访问响应模型 (Web I/O): 单线程I/O结构:启动一个进程处理用户请求,而且一次只处理一个:多个请求被串行响应 多线程I/O结构:并行启动多个线程,每个进程响应一个请求 复用I/O结构: 一个进程响应n个请求 多线程模型:一个进程生成N个线程,每个线程响应一个用户请求 事件驱动: event-driven 复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求 3. 处理请求:对请求报文进行解析,并获取请求的资源及请求方法等相关信息 元数据:请求报文首部 <method> <URL> <VERSION> Host:www.magedu.com 请求的主机名称 Connection: 4.访问资源: 获取请求报文中请求的资源 web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源;这些资源放置于本地文件系统某路径下,此路径通常称为DocRoot /var/www.html images/1.jpg web服务器资源路径映射方式 a. docroot b. alias c. 虚拟主机docroot d. 用户家目录docroot 5. 构建响应报文 资源的MIME类型 显示分类 魔法分类 协商分类 URL重定向: web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径 6. 发送响应报文 7. 记录日志
http协议:hyper text transfer protocol (80/tcp)
版本
HTTP/0.9: 原型版本,简陋 HTTP/1.0: 第一个广泛使用的版本,引用了MIME机制,但是缓存机制比较简陋
MIME: Multipurpose Internet Mail Extension 多用途网络邮件扩展
HTTP/1.1: 增强了缓存功能 HTTP/2.0:
httpd协议:stateless, 服务器无法持续追踪访问来源, 基于cookie、session机制来追踪客户端的行为
http事务:一次请求(request)和一次响应(response)的过程
request报文 <method><request-URL><version> <headers> <entity-body> response报文 <version><status><reason-phrase> //version:HTTP/<major>.<minor>;status:三位数字标记请求处理过程中的情况;reason-phrase:状态码所标记的状态的简要描述 <headers> //每个请求或响应报文可包含任意个首部 <entity-body> //请求时附加的数据或响应时附加的数据
method(方法) GET: 从服务器获取一个资源 HEAD: 只从服务器获取文档的响应首部 POST:向服务器发送要处理的数据 PUT: 将请求的主体部分存储在服务器上 DELETE: 请求删除服务器上指定的文档 TRACE: 追踪请求到达服务器中间经过的代理服务器 OPTIONS: 请求服务器返回对指定资源支持使用的请求方法
status(状态码) 1XX: 100-101,信息提示 2XX: 200-206, 成功类信息 3XX:300-305, 重定向,提示需进一步提供补充类信息的状态码 4XX: 400-415,客户端错误 5XX: 500-505,服务器端错误 常用的状态码: 200:成功,请求的所有数据通过响应报文的entity-body部分发送:OK 301: 请求的url指向的资源已经被删除;但在响应报文中通过首部location指明了资源现在所处的位置,永久重定向 302: 与301相似,但在响应报文中通过location指明了资源现在所处的临时位置 304:客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此状态码通知客户端,not modify 401: 需要输入账号和密码认证方能访问资源:unauthorized 403: 请求被禁止,forbidden 404: 服务器无法找到客户端请求的资源,not found 500: 服务器内部错误: internal server error 502: 代理服务器从后端服务器收到了一条伪响应,bad gateway
header
格式:
Name : Value
首部分类:
通用首部 请求首部 响应首部 实体首部 扩展首部
通用首部: Date: 报文的创建时间 connection: 连接方式,如keep-alive,close via: 显示报文经过的中间节点 cache-control:控制缓存 pragma:
请求首部: accept: 通过服务器自己可接受的媒体类型 accept-charset: accept-encoding: 接受编码格式,如gzip accept-language: 接受的语言 client-IP:客户端IP Host: 请求的服务器名称和端口号 Referer: 包含当前正在请求的资源的上一级资源 User-Agent: 客户端代理 条件式请求首部 expect:期望发什么信息 if-modify-since: 自从指定的时间之后,请求的资源是否发生修改过 if-unmodified-since: 自从指定的时间之后,请求的资源是否没有修改 if-none-match: 本地缓存中存储的文档的etag标签是否与服务器文档的etag不匹配 if-match:本地缓存中存储的文档的扩展标签etag是否与服务器文档的etag匹配 安全请求首部: authorization: 向服务器发送认证信息,如账号和密码 cookie: 客户端向服务器端发送cookie cookie2 代理请求首部: proxy-authorization:向代理服务器认证
响应首部: 信息性: age: 响应持续时长 server:服务器程序软件名称和版本 协商首部:某资源有多种表示方法时使用 accept-ranges: 服务器可接受的请求范围类型 vary: 服务器查看的其他首部列表 安全响应首部 set-cookie: 向客户端设置cookie set-cookie2:向客户端设置第二版的cookie www-authenticate: 来自服务器的对客户端的质询认证表单
实体首部: allow: 列出对此实体可使用的请求方法 location: 告诉客户端真正的实体位于何处,重定向时使用 content-encoding:内容的编码格式 content-language:内容的语言 content-length: 主体的长度 content-location: 实体真正所处位置 content-type: 主体的对象类型 缓存相关 eTag: 实体的扩展标签 expires: 实体的过期时间 last-Modified: 最后一次修改的时间
协议查看或分析的工具:
tcpdump, tshark, wireshark