http协议及httpd安装组成-一、http协议

http协议通信过程

HTTP(HyperText Transfer Protocol,超文本传输协议,默认端口:80/tcp)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础设计HTTP最初的目的是为了提供一种远距离共享知识的方式,借助多文档进行关联实现超文本,连成相互参阅的WWW(world wide web,万维网)。在这里插入图片描述

http相关技术

1.web开发语言
html
Hyper Text Markup Language 超文本标记语言,编程语言,主要负责实现页面的结构
CSS
Cascading Style Sheet 层叠样式表, 定义了如何显示(装扮) HTML 元素,比如:字体大小和颜色属性等。样式通常保存在外部的 .css 文件中,用于存放一些HTML文件的公共属性,从而通过仅编辑一个简单的 CSS 文档,可以同时改变站点中所有页面的布局和外观。
js
javascript,实现网页的动画效果,但实属于静态资源。

2.MIME
MIME(Multipurpose Internet Mail Extensions)协议是一种互联网标准,用于在电子邮件和其他互联网应用中扩展消息格式。它为不同类型的数据在互联网上的传输和处理提供了一个标准化的框架。
一些常见的MIME类型包括:

  • text/plain: 纯文本
  • text/html: HTML文本
  • image/jpeg: JPEG图像
  • audio/mpeg:MP3音频
  • video/mp4: MP4视频
  • application/pdf: PDF文档
  • application/octet-stream: 二进制数据
    简单来说:如果文件的格式在上述类型中,我们可以直接打开,如果不在,电脑执行下载。

3.URI
URI: Uniform Resource Identifier 统一资源标识,分为URL 和 URN
URN:Uniform Resource Naming,统一资源命名
URL:Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置
两者区别:

  • URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地URL组成。

在这里插入图片描述

  • scheme:协议,访问服务器以获取资源时要使用哪种协议
  • user:用户,某些方案访问资源时需要的用户名
  • password:密码,用户对应的密码,中间用:分隔
  • post:主机,资源宿主服务器的主机名或IP地址
  • port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号
  • path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔
  • params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔
  • query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔
  • frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔

网站访问量

  • IP(独立IP):即Internet Protocol,指独立IP数。
  • PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页面数量。
  • UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过cookies实现的。如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的。

HTTP工作机制

一次http事务包括:

  • http请求:http request
  • http响应:http response

Web资源:web resource, 一个网页由多个资源(文件)构成,打开一个页面,通常会有多个资源展示出来,但是每个资源都要单独请求。因此,一个"Web 页面”通常并不是单个资源,而是一组资源的集合。则需要多个tcp链接。

资源类型:

  • 静态文件:无需服务端做出额外处理,服务器端和客户端的文件内容相同。
    常见文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi

  • 动态文件:服务端执行程序,返回执行的结果,服务器端和客户端的文件内容不相同。
    常见文件后缀:.php, .jsp ,.asp

提高HTTP连接性能

  • 并行连接:通过多条TCP连接发起并发的HTTP请求
  • 持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
  • 管道化连接:通过共享TCP连接,发起并发的HTTP请求
  • 复用的连接:交替传送请求和响应报文

HTTP协议版本

1.http 0.9版本:原型版本,功能简陋,只能执行下载命令。
2.http 1.0版本:加入了多种方法,不仅仅能下载,还能上传,不支持长链接。
3.http1.1版本:引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,是运用最广泛的版本。

HTTP请求访问的完整过程

1.建立连接
2.接收请求
3.处理请求
4.访问资源
5.构建响应报文
6.发送响应报文
7.记录日志
在这里插入图片描述

1.建立连接:
客户端发送请求至服务端,服务端接受或拒绝连接请求。
2.接收请求:
接收客户端请求报文中对资源的一次请求的过程。

  • 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
  • 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
  • 复用I/O结构:启动一个进程,同时响应N个连接请求
  • 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
    在这里插入图片描述
    3.处理请求:
    服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理。
    常用请求的方法:GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS
    4.访问资源:
    服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源。
    5.构建响应报文:
    一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:

描述了响应主体MIME类型的Content-Type首部

描述了响应主体长度的Content-Length 实际报文的主体内容。

2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径。

3)MIME类型: Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来。
6.发送响应报文:
Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束。

7、记录日志:

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务。

HTTP报文头部

请求报文
在这里插入图片描述

方法:

  • GET: 获取资源 当前网络请求中,绝大部分使用的是 GET 方法
  • HEAD: 获取报文首部,主要用于确认 URL 的有效性以及资源更新的日期时间等
  • POST: 传输实体主体 (比如传输 用户名密码)
  • PUT: 上传文件(比如写博客)
  • PATCH: 对资源进行部分修改
  • DELETE:删除文件
  • OPTIONS:查询支持的方法(查看服务端可以支持哪些方法)
  • CONNECT:要求在与代理服务器通信时建立隧道(类似加密)
  • TRACE:追踪路径

URL:指明资源位置

<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
  • scheme协议

    • http 超文本传输协议
    • https 安全的http协议
    • ftp 文件传输协议
  • user:帐号

  • password:密码

  • host:主机名 或 域名 或 ip地址

  • port: 服务器端口号

  • path:访问资源的路径,相当于组件路径

  • params:参数,但是这个不常用,指定一些参数,譬如指定传输方式

  • qurey:查询参数

  • frag:html资源片段,譬如html文档过大的时候,frag定位到html的一部分。

首部字段:
使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容,HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:” 分隔 。

实体:
请求时附加的数据或响应时附加的数据,例如:登录网站时的用户名和密码,博客的上传文章,论坛上的发言等。

响应报文

在这里插入图片描述
状态码:
三位数字,标记请求处理过程中发生的情况。

http协议状态码分类
1xx:100-101 信息提示
2xx:200-206 成功连接
3xx:300-307 重定向
4xx:400-415 错误类信息,客户端错误
5xx:500-505 错误类信息,服务器端错误

http协议常用的状态码
200: 成功,请求数据通过响应报文的entity-body部分发送;
301: 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;
302: 响应报文Location指明资源临时新位置
304: 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;
307: 浏览器内部重定向
401: 需要输入账号和密码认证方能访问资源;
403: 请求被禁止;
404: 服务器无法找到客户端请求的资源;
500: 服务器内部错误;
502: 代理服务器从后端服务器收到了一条伪响应,如无法连接到网关;
503: 服务不可用,临时服务器维护或过载,服务器无法处理请求,比如:php服务停止,无法处理php程序
504: 网关超时

上一篇:3D工业视觉


下一篇:HackTheBox-Machines--Shocker-1 信息收集