通过Java代码浅谈HTTP协议

2023-08-27 12:33:16

最近刚看了http协议，想写点东西加深一下理解，如果哪儿写错了，请指正。

1 介绍

HTTP是Hyper Text Transfer Protocol（超文本传输协议）的缩写。它的发展是万维网协会（World Wide Web Consortium）和Internet工作小组IETF（Internet Engineering Task Force）合作的结果，（他们）最终发布了一系列的RFC，RFC 1945定义了HTTP/1.0版本。其中最著名的就是RFC 2616。RFC 2616定义了今天普遍使用的一个版本——HTTP 1.1。

HTTP协议（HyperText Transfer Protocol，超文本传输协议）是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效，使网络传输减少。它不仅保证计算机正确快速地传输超文本文档，还确定传输文档中的哪一部分，以及哪部分内容首先显示(如文本先于图形)等。

1.1 http请求模型

这样就限制了使用HTTP协议，无法实现在客户端没有发起请求的时候，服务器将消息推送给客户端.

1.2 工作流程

一次HTTP操作称为一个事务，其工作过程可分为四步：

1）首先客户机与服务器需要建立连接。只要单击某个超级链接，HTTP的工作开始。

2）建立连接后，客户机发送一个请求给服务器，请求方式的格式为：统一资源标识符（URL）、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。

3）服务器接到请求后，给予相应的响应信息，其格式为一个状态行，包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息、实体信息和可能的内容。

4）客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上，然后客户机与服务器断开连接。

如果在以上过程中的某一步出现错误，那么产生错误的信息将返回到客户端，有显示屏输出。对于用户来说，这些过程是由HTTP自己完成的，用户只要用鼠标点击，等待信息显示就可以了。

2 利用java代码测试各个协议头

一个完整的http协议包括请求和响应，下面我们一一介绍：

2.1 请求篇

http请求由三部分组成，分别是：请求行、消息报头、请求正文

请求行以一个方法符号开头，以空格分开，后面跟着请求的URI和协议的版本，格式如下：Method Request-URI HTTP-Version CRLF
其中 Method表示请求方法；Request-URI是一个统一资源标识符；HTTP-Version表示请求的HTTP协议版本；CRLF表示回车和换行（除了作为结尾的CRLF外，不允许出现单独的CR或LF字符）。

请求方法（所有方法全为大写）有多种，各个方法的解释如下：
GET     请求获取Request-URI所标识的资源
POST    在Request-URI所标识的资源后附加新的数据
HEAD    请求获取由Request-URI所标识的资源的响应消息报头
PUT     请求服务器存储一个资源，并用Request-URI作为其标识
DELETE 请求服务器删除Request-URI所标识的资源
TRACE   请求服务器回送收到的请求信息，主要用于测试或诊断
CONNECT 保留将来使用
OPTIONS 请求查询服务器的性能，或者查询与资源相关的选项和需求
应用举例：
GET方法：在浏览器的地址栏中输入网址的方式访问网页时，浏览器采用GET方法向服务器获取资源，eg:GET /form.html HTTP/1.1 (CRLF)

POST方法要求被请求服务器接受附在请求后面的数据，常用于提交表单。
eg：POST /reg.jsp HTTP/ (CRLF)
Accept:image/gif,image/x-xbit,... (CRLF)
...
HOST:www.guet.edu.cn (CRLF)
Content-Length:22 (CRLF)
Connection:Keep-Alive (CRLF)
Cache-Control:no-cache (CRLF)
(CRLF) //该CRLF表示消息报头已经结束，在此之前为消息报头
user=jeffrey&pwd=1234 //此行以下为提交的数据

HEAD方法与GET方法几乎是一样的，对于HEAD请求的回应部分来说，它的HTTP头部中包含的信息与通过GET请求所得到的信息是相同的。利用这个方法，不必传输整个资源内容，就可以得到Request-URI所标识的资源的信息。该方法常用于测试超链接的有效性，是否可以访问，以及最近是否更新。

我们运用命令行命令Telnet进行测试：

1. 使用telnet连接到HTTP服务器，如要从google上请求index.html页面，首先要连接到服务器的80端口

telnet www.google.cn 80

2. 现在已经连接上了服务器，发送http请求消息：

GET /index.html HTTP/1.1

connection: close

Host: www.google.cn

输入上面内容后，连续敲入两个回车，哈哈，是不是看到返回结果了。

这个请求的意思是：通过1.1版本协议请求index.html页面；connection: close是实用短连接，即服务器返回后就断开连接；Host字段知名页面所在的主机名。

返回结果应该是这样的：

HTTP/1.1 200 OK

Cache-Control: private, max-age=0

Date: Fri, 02 Jan 2009 12:26:17 GMT

Expires: -1

Content-Type: text/html; charset=GB2312

Set-Cookie: PREF=ID=7bbe374f53b6c6a8:NW=1:TM=1230899177:LM=1230899177:S=2EGHuZJnrtdQUB_A; expires=Sun, 02-Jan-2011 12:26:17 GMT; path=/; domain=.google.com

Server: gws

Transfer-Encoding: chunked

Connection: Close

这里有一个额外的CRLF

<html>

html数据

</html>

2、请求报头后述
3、请求正文(略)

2.2 响应篇

响应消息包括状态行、若干头部行和附属体（html数据实体）。

状态行

状态行包括：HTTP协议版本号、状态码、状态码的文本描述信息。如：HTTP/1.1 200 OK

状态码由一个三位数组成，状态码大体有5种含义：

1. 1xx。信息，请求收到，继续处理。

2. 2xx。成功。200请求成功；206断点续传。

3. 3xx。重定向。一般跳转到新的地址。

4. 4xx。客户端错误。404文件不存在

5. 5xx。服务器错误。500内部错误。

常见状态代码、状态描述、说明：
200 OK //客户端请求成功
400 Bad Request //客户端请求有语法错误，不能被服务器所理解
401 Unauthorized //请求未经授权，这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden //服务器收到请求，但是拒绝提供服务
404 Not Found //请求资源不存在，eg：输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable //服务器当前不能处理客户端的请求，一段时间后可能恢复正常
eg：HTTP/1.1 200 OK （CRLF）

头部行

Set-Cookie：服务器设置客户端Cookie。设置格式是name=value，设置多个参数时中间用分号隔开。Set-Cookie时还会用到几个参数：PATH设置有效的路径，DOMAIN设置cookie生效的域名，Expire设置cookie的有效时间，0表示关闭浏览器就失效。

Location：当服务器返回3xx重定向时，该参数实现重定向。广告链接的跳转就使用这种协议。

Content-Length：附属体（数据实体）的长度

2.3 测试协议头 ----响应头

通过在服务器端设置响应头，我们可以控制浏览器，在myeclipse搭建tomcat服务器我们简单地对几个进行了测试：

1，通知浏览器采用压缩数据方式发送，测试content-encoding和content-length

         String data="aaaaaaaaaaa";

         System.out.print("原始数据大小："+data.getBytes().length);

         ByteArrayOutputStream bout=new ByteArrayOutputStream();

         GZIPOutputStream gout=new GZIPOutputStream(bout);

         gout.write(data.getBytes());

         gout.close();

         byte gzip[]=bout.toByteArray();

         System.out.print("压缩后数据大小："+gzip.length);

         response.setHeader("Content-Encoding", "gzip");

         response.setHeader("Content-Length", gzip.length+"");

         response.getOutputStream().write(gzip);

2，重定向测试location

         response.setStatus(302);

         response.setHeader("Location","/web1/1.html");

3，通知浏览器以哪种方式打开数据测试content-type

         response.setHeader("content-type", "image/bmp");

         InputStream in=this.getServletContext().getResourceAsStream("/1.bmp");

         int len=0;

         byte buffer[]=new byte[1024];

         OutputStream out=response.getOutputStream();

         while((len=in.read(buffer))>0){

             out.write(buffer,0,len);

         }

4，定时刷新跳转测试refresh 3秒后刷新然后跳到百度首页

         response.setHeader("refresh", "3;url='http://uwww.baidu.com'");

         String data="aaaaaaaaaaaaaa";

         response.getOutputStream().write(data.getBytes());

5，下载方面的测试 content-disposition

1         response.setHeader("content-disposition","attachment;filename=2.bmp");

         InputStream in=this.getServletContext().getResourceAsStream("/2.bmp");

         int len=0;

         byte buffer[]=new byte[1024];

         OutputStream out=response.getOutputStream();

         while((len=in.read(buffer))>0){

             out.write(buffer,0,len);

         }

上面只是我的浅见，刚看完想写个博客，有错误欢迎指正！谢谢！

码农公寓