【nginx】关于gzip压缩

有这么一段配置文件

gzip on
# 默认值: gzip off
# 开启或者关闭gzip模块 gzip_static off;
# nginx对于静态文件的处理模块
# 该模块可以读取预先压缩的gz文件,这样可以减少每次请求进行gzip压缩的CPU资源消耗。该模块启用后,nginx首先检查是否存在请求静态文件的gz结尾的文件,如果有则直接返回该gz文件内容。为了要兼容不支持gzip的浏览器,启用gzip_static模块就必须同时保留原始静态文件和gz文件。这样的话,在有大量静态文件的情况下,将会大大增加磁盘空间。我们可以利用nginx的反向代理功能实现只保留gz文件。
# 可以google"nginx gzip_static"了解更多 gzip_comp_level 4;
# 默认值:1(建议选择为4)
# gzip压缩比/压缩级别,压缩级别 1-9,级别越高压缩率越大,当然压缩时间也就越长(传输快但比较消耗cpu)。 gzip_buffers 4 16k;
# 默认值: gzip_buffers 4 4k/8k
# 设置系统获取几个单位的缓存用于存储gzip的压缩结果数据流。 例如 4 4k 代表以4k为单位,按照原始数据大小以4k为单位的4倍申请内存。 4 8k 代表以8k为单位,按照原始数据大小以8k为单位的4倍申请内存。
# 如果没有设置,默认值是申请跟原始数据相同大小的内存空间去存储gzip压缩结果。 gzip_types text/plain application/x-javascript text/css application/xml text/javascript application/x-httpd-php image/jpeg image/gif image/png;
#gzip_types mime-type [mime-type ...];
# 默认值: gzip_types text/html (默认不对js/css文件进行压缩)
# 压缩类型,匹配MIME类型进行压缩
# 不能用通配符 text/*
# (无论是否指定)text/html默认已经压缩
# 设置哪压缩种文本文件可参考 conf/mime.types gzip_min_length 1k;
# 默认值: 0 ,不管页面多大都压缩
# 设置允许压缩的页面最小字节数,页面字节数从header头中的Content-Length中进行获取。
# 建议设置成大于1k的字节数,小于1k可能会越压越大。 即: gzip_min_length 1024 gzip_http_version 1.0
# 默认值: gzip_http_version 1.1(就是说对HTTP/1.1协议的请求才会进行gzip压缩)
# 识别http的协议版本。由于早期的一些浏览器或者http客户端,可能不支持gzip自解压,用户就会看到乱码,所以做一些判断还是有必要的。
# 注:99.99%的浏览器基本上都支持gzip解压了,所以可以不用设这个值,保持系统默认即可。
# 假设我们使用的是默认值1.1,如果我们使用了proxy_pass进行反向代理,那么nginx和后端的upstream server之间是用HTTP/1.0协议通信的,如果我们使用nginx通过反向代理做Cache Server,而且前端的nginx没有开启gzip,同时,我们后端的nginx上没有设置gzip_http_version为1.0,那么Cache的url将不会进行gzip压缩 gzip_proxied any
#gzip_proxied [off|expired|no-cache|no-store|private|no_last_modified|no_etag|auth|any] ...;
# 默认值:off
# Nginx作为反向代理的时候启用,开启或者关闭后端服务器返回的结果,匹配的前提是后端服务器必须要返回包含"Via"的 header头。
# off - 关闭所有的代理结果数据的压缩
# expired - 启用压缩,如果header头中包含 "Expires" 头信息
# no-cache - 启用压缩,如果header头中包含 "Cache-Control:no-cache" 头信息
# no-store - 启用压缩,如果header头中包含 "Cache-Control:no-store" 头信息
# private - 启用压缩,如果header头中包含 "Cache-Control:private" 头信息
# no_last_modified - 启用压缩,如果header头中不包含 "Last-Modified" 头信息
# no_etag - 启用压缩 ,如果header头中不包含 "ETag" 头信息
# auth - 启用压缩 , 如果header头中包含 "Authorization" 头信息
# any - 无条件启用压缩 gzip_vary on;
# 和http头有关系,加个vary头,给代理服务器用的,有的浏览器支持压缩,有的不支持,所以避免浪费不支持的也压缩,所以根据客户端的HTTP头来判断,是否需要压缩 gzip_disable "MSIE [1-6].";
# 禁用IE6的gzip压缩,又是因为杯具的IE6。当然,IE6目前依然广泛的存在,所以这里你也可以设置为“MSIE [1-5].”
# IE6的某些版本对gzip的压缩支持很不好,会造成页面的假死,为了确保其它的IE6版本不出问题,所以建议加上gzip_disable的设置

  

1、gzip_comp_level

text/html - phpinfo():

0    55.38 KiB (100.00% of original size)
1 11.22 KiB ( 20.26% of original size)
2 10.89 KiB ( 19.66% of original size)
3 10.60 KiB ( 19.14% of original size)
4 10.17 KiB ( 18.36% of original size)
5 9.79 KiB ( 17.68% of original size)
6 9.62 KiB ( 17.37% of original size)
7 9.50 KiB ( 17.15% of original size)
8 9.45 KiB ( 17.06% of original size)
9 9.44 KiB ( 17.05% of original size)

application/x-javascript - jQuery 1.8.3 (Uncompressed):

0    261.46 KiB (100.00% of original size)
1 95.01 KiB ( 36.34% of original size)
2 90.60 KiB ( 34.65% of original size)
3 87.16 KiB ( 33.36% of original size)
4 81.89 KiB ( 31.32% of original size)
5 79.33 KiB ( 30.34% of original size)
6 78.04 KiB ( 29.85% of original size)
7 77.85 KiB ( 29.78% of original size)
8 77.74 KiB ( 29.73% of original size)
9 77.75 KiB ( 29.74% of original size)

这里没有考虑CPU使用率,理想的压缩级别在4-6之间

2、gzip_static

  • 该模块可以读取预先压缩的gz文件,这样可以减少每次请求进行gzip压缩的CPU资源消耗。该模块启用后,nginx首先检查是否存在请求静态文件的gz结尾的文件,如果有则直接返回该gz文件内容。为了要兼容不支持gzip的浏览器,启用gzip_static模块就必须同时保留原始静态文件和gz文件。这样的话,在有大量静态文件的情况下,将会大大增加磁盘空间。我们可以利用nginx的反向代理功能实现只保留gz文件。
  • # 可以google"nginx gzip_static"了解更多
  • 使用PHP预先压缩如下
function gzip_static($path)
{
if ((extension_loaded('zlib') === true) && (is_file($path) === true))
{
$levels = array();
$content = file_get_contents($path); foreach (range(1, 9) as $level)
{
$levels[$level] = strlen(gzencode($content, $level));
} if ((count($levels = array_filter($levels)) > 0) && (min($levels) < strlen($content)))
{
if (file_put_contents($path . '.gz', gzencode($content, array_search(min($levels), $levels)), LOCK_EX) !== false)
{
return touch($path . '.gz', filemtime($path), fileatime($path));
}
}
} return false;
}

3、开启缓存

location ~* \.(ico|jpe?g|gif|png|bmp|swf|flv)(\?[0-9]+)?$ {
valid_referers none blocked www.xx.com xx.com expires 30d;
log_not_found off;
access_log off;
} location ~* \.(js|css)$ {
expires 7d;
log_not_found off;
access_log off;
} location = /(favicon.ico|roboots.txt) {
access_log off;
log_not_found off;
} location ~* \.(htacess|svn|tar.gz|tar|zip|sql) {
return 404;
} location ~* \.(eot|ttf|otf|woff|svg)$ {
access_log off;
expires max;
}

4、gzip_vary

要了解 Vary 的作用,先得了解 HTTP 的内容协商机制。有时候,同一个 URL 可以提供多份不同的文档,这就要求服务端和客户端之间有一个选择最合适版本的机制,这就是内容协商

vary机制是http1.1 协议的新特性,使得server端可以根据用户请求返回给用户不同的内容,现在互联网中应用vary最广的一点就是对压缩的支持,例如当用户请求带着header “Accept-Encoding: gzip,deflate”,表明用户期望从server端拿到压缩的内容,这样server端会给用户一个包含压缩内容的文件,并带着vary头“vary: Accept-Encoding”头,和“Content-Encoding:gzip ”头,如果用户请求非压缩的内容,源站也就可以给用户非压缩的内容。

这个出问题很多时候在于缓存服务的时候,比如squid

这个启用之后,response header 中会加上 Vary: Accept-Encoding

gzip_vary on;

用 curl 验证

[root@AY ~]# curl -I -v http://common.cnblogs.com/script/jquery.js
* About to connect() to common.cnblogs.com port 80 (#0)
* Trying 42.121.254.191... connected
* Connected to common.cnblogs.com (42.121.254.191) port 80 (#0)
> HEAD /script/jquery.js HTTP/1.1
> User-Agent: curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2
> Host: common.cnblogs.com
> Accept: */*
>
< HTTP/1.1 200 OK
HTTP/1.1 200 OK
< Date: Sun, 22 Nov 2015 11:21:55 GMT
Date: Sun, 22 Nov 2015 11:21:55 GMT
< Content-Type: application/javascript
Content-Type: application/javascript
< Content-Length: 94020
Content-Length: 94020
< Connection: keep-alive
Connection: keep-alive
< Vary: Accept-Encoding
Vary: Accept-Encoding
< Cache-Control: public,max-age=25920000
Cache-Control: public,max-age=25920000
< Last-Modified: Fri, 15 Feb 2013 03:06:57 GMT
Last-Modified: Fri, 15 Feb 2013 03:06:57 GMT
< Accept-Ranges: bytes
Accept-Ranges: bytes
< ETag: "7468b58329bce1:0"
ETag: "7468b58329bce1:0" <
* Connection #0 to host common.cnblogs.com left intact
* Closing connection #0

  

参考

http://nginx.org/en/docs/http/ngx_http_gzip_static_module.html

http://serverfault.com/questions/253074/what-is-the-best-nginx-compression-gzip-level

http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html

http://weblogs.asp.net/owscott/iis-7-compression-good-bad-how-much

上一篇:Docker 移除镜像


下一篇:使用Aspose.Word的基础知识整理