一.HTTP协议基础
1.定义:HTTP是基于TCP连接的浏览器与服务器通信协议。(即传输层先用TCP三次握手建立连接,进而HTTP通信)
2.连接原理:先进行TCP建立端到端连接,然后发送和接受HTTP报文。
TCP(Socket)是端到端的连接,通过IP地址和端口号用于定位网络上两台主机的具体运行程序。所以HTTP连接会先启动TCP连接来建立与服务器软件的连接,然后发送和接受HTTP报文内容。所以当运行抓包器,打开网页时,会看到一个TCP连接和HTTP连接。在用HTTP 1.0版本时,每打开一个网页就会TCP连接一次。而TCP的每次连接都消耗系统资源(包括CPU和内存)。HTTP1.1版本的TCP连接时持续连接,及请求头默认设置KEEP-ALive=TRUE。这种情况用一份TCP连接传输多次请求。典型就是ajax应用。
3.模拟发送/响应HTTP报文
故:完全可以用Java Socket编写程序模仿客户端浏览器发送http请求。当然,即可实现客户端软件的文件下载功能。
代码如下:模拟发送http请求
- Socket s = new Socket(InetAddress.getLocalHost(), 8080);
- OutputStreamWriter osw = new OutputStreamWriter(s.getOutputStream());
- StringBuffer sb = new StringBuffer();
- sb.append("GET /HttpStream/gb2312.jsp HTTP/1.1\r\n");
- sb.append("Host: localhost:8088\r\n");
- sb.append("Connection: Keep-Alive\r\n");
- //注,这是关键的关键,忘了这里让我搞了半个小时。这里一定要一个回车换行,表示消息头完,不然服务器会等待
- sb.append("\r\n");
- osw.write(sb.toString());
- osw.flush();
//模拟读取HTTP响应
- InputStream is = s.getInputStream();
- String line = null;
- int contentLength = 0;//服务器发送回来的消息长度
- // 读取所有服务器发送过来的请求参数头部信息
- do {
- line = readLine(is, 0);
- //如果有Content-Length消息头时取出
- if (line.startsWith("Content-Length")) {
- contentLength = Integer.parseInt(line.split(":")[1].trim());
- }
- //打印请求部信息
- System.out.print(line);
- //如果遇到了一个单独的回车换行,则表示请求头结束
- } while (!line.equals("\r\n"));
- //--输消息的体
- System.out.print(readLine(is, contentLength));
- //关闭流
- is.close();
- } catch (UnknownHostException e) {
- e.printStackTrace();
- } catch (IOException e) {
- e.printStackTrace();
- }
- }
- //readLine()方法实现未给出,因为我感觉那个读取方法的效率不高。有兴趣可参考原作者代码。
(代码转自http://blog.csdn.net/a9529lty/article/details/7174265,感谢原作者)
二.关于http文件上传和下载
Socket模拟HTTP上传文件代码
- File file=new File("c:/雪狼突击队.jpg");
- //将文件读成字符串
- String picString=readFileAsString(file.toString());
- //URLEncode
- picString="picdata="+URLEncoder.encode(picString, "UTF-8");
- String url="http://localhost:8080/Test/index.jsp?uid=1&username=test&auth=098f6bcd4621d373cade4e832627b4f6";
- Socket socket =new Socket(InetAddress.getByName(url),80);
- DataOutputStream dos=new DataOutputStream(socket.getOutputStream());
- String message=""
- +"POST "+url+" HTTP/1.1 \r\n "
- +"Host: test.lingye.com \r\n "+"Accept: */* \r\n "
- +"Cache-Control:no-cache \r\n" +"User-Agent: MSIE6.0; \r\n "
- +"Content-Type: application/x-www-form-urlencoded \r\n "
- +"Content-Length: "+picString.length()+" \r\n "
- +"Connection: Close \r\n\r\n"//报头以两个\n作为结束标志
- +picString+"\r\n ";//post数据
- byte buffer[]=message.getBytes();
- dos.write(buffer);
- dos.flush();
- dos.close();
- //以上只进行了发送操作
- socket.close();
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
- 服务器端servlet
- public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
- String picdata =request.getParameter("picdata");
- //注意这里的picData是图片对应的Encode编码方式,同一个编码和同一个解码方式
- BASE64Decoder base64=new BASE64Decoder();
- //64位解码
- byte[] buffer=base64.decodeBuffer(picdata);
- //写进文件
- FileOutputStream fos=new FileOutputStream("c:/雪狼突击队1.jpg");
- fos.write(buffer);
- fos.flush();
- fos.close();
- fos=null;
- }
(代码转自http://blog.sina.com.cn/s/blog_5da93c8f0100vj3v.html,感谢作者)
以上可以看出,Java语言可以编写浏览器,当然浏览器功能很复杂。浏览器对http响应的html代码进行解析,就形成了我们看到的网页。
注意看socket模拟http请求和响应的方法,可以看出读取输入流/输出流都是在一个socket连接中获得的,即每次TCP连接(3次握手后),都会有一个对应的输入和输出。利用该输入输出流就可以发送和接受数据。
4.协议内容详解
参考http://www.cnblogs.com/li0803/archive/2008/11/03/1324746.html,协议具体内容讲解很详细
5.关于http1.0和http1.1的持续连接与非持续连接
HTTP/1.0和HTTP/1.1都有非持续连接(non-persistent connection)和持续连接(persistent connection)功能。非持续连接是指启动一次TCP连接服务机就向客户机传送一个对象,而持续连接是指服务机可在相同的TCP连接上向客户机发送多个对象。HTTP/1.0的默认设置是非持续连接,而HTTP/1.1的默认设置是持续连接。
在使用HTTP/1.0的情况下,如果打开一个包含一个HTML文件和10个内联图象对象的网页时,HTTP就要建立11次TCP连接才能把文件从服务机传送到客户机。而使用HTTP/1.1的情况下,如果打开同样的文件时,HTTP建立一次TCP连接就可把文件从服务机传送到客户机。使用一次TCP连接传送一个对象的效率比较低,这体现在下列几个方面:
(1) 每次TCP连接必需要建立和断开。客户机和服务机建立一次连接需要执行三向沟通连接法(three-way handshake),服务机在对象递送之后要断开TCP连接。在建立和断开连接时要占用CPU的资源。如果使用一次连接代替11次连接的话,占用客户机和服务机的CPU时间可大大减少。
(2) 对每次连接,客户机和服务机都必须分配发送和接收缓存。这就意味着要影响客户机和服务机的存储器资源,这同样要占用CPU的时间。
(3) 对由大数量对象组成的文件,TCP的低速启动算法(slow start-up algorithm)会限制服务机向客户机传送对象的速度。使用HTTP/1.1之后,大多数对象都可以尽最大的速率传送。
由于HTTP/1.1允许持续连接,文件中的所有对象都可在相同的TCP连接上传送。HTTP/1.1也允许在客户机接收到服务机的消息响应之前发送多个消息请求,这叫做流水线式请求(pipelined request)。
(此段转自http://blog.chinaunix.net/uid-9681606-id-1998549.html,感谢作者贡献)
6.
请问为什么get方式的请求消息中没有实体内容呢?
,我有点疑问,为什么get方式的请求消息中没有实体内容,请求消息中的实体内容值的什么啊,参数不是实体内容吗?