nginx在web应用上的占用率越来越高,其带的模块也越来越来。nginx_cache算是一个,虽和专业的cache工具相比略逊一筹,但毕竟部署简单,不用另装软件和资源开销,所以在web cache中也占了比重不小的一席。不过像squid和varnish等cache软件都自带的有cache查看工具,而且还可以方便的在http header上显示出是否命中。nginx主要还是做web使用。所以想要得出命中率的大小,还需要通过日志进行统计,不过想要增加header查看倒很简单

一、在http header上增加命中显示

nginx提供了$upstream_cache_status这个变量来显示缓存的状态,我们可以在配置中添加一个http头来显示这一状态,达到类似squid的效果。

 1location  / {
 2        proxy_redirect          off;
 3        proxy_set_header        Host            $host;
 4        proxy_set_header        X-Real-IP       $remote_addr;
 5        proxy_set_header        X-Forwarded-For $proxy_add_x_forwarded_for;
 6        proxy_connect_timeout   180;
 7        proxy_send_timeout      180;
 8        proxy_read_timeout      180;
 9        proxy_buffer_size       128k;
10        proxy_buffers           4 128k;
11        proxy_busy_buffers_size 128k;
12        proxy_temp_file_write_size 128k;
13        proxy_cache cache;
14        proxy_cache_valid 200 304 1h;
15        proxy_cache_valid 404 1m;
16        proxy_cache_key $uri$is_args$args;
17        add_header  Nginx-Cache "$upstream_cache_status";
18        proxy_pass http://backend;
19    }

而通过curl或浏览器查看到的header如下:

1HTTP/1.1 200 OK
2Date: Mon, 22 Apr 2013 02:10:02 GMT
3Server: nginx
4Content-Type: image/jpeg
5Content-Length: 23560
6Last-Modified: Thu, 18 Apr 2013 11:05:43 GMT
7Nginx-Cache: HIT
8Accept-Ranges: bytes
9Vary: User-Agent

$upstream_cache_status包含以下几种状态:

  • MISS 未命中,请求被传送到后端
  • HIT 缓存命中
  • EXPIRED 缓存已经过期请求被传送到后端
  • UPDATING 正在更新缓存,将使用旧的应答
  • STALE 后端将得到过期的应答

二、nginx cache命中率统计

即然nginx为我们提供了$upstream_cache_status函数,自然可以将命中状态写入到日志中。具体可以如下定义日志格式:

1log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
2                  '$status $body_bytes_sent "$http_referer" '
3                  '"$http_user_agent" "$http_x_forwarded_for"'
4                  '"$upstream_cache_status"';

命中率统计方法:用HIT的数量除以日志总量得出缓存命中率:

1awk '{if($NF==""HIT"") hit++} END {printf "%.2f%",hit/NR}' access.log

了解了原理以后,也可以通过crontab脚本将每天的命中率统计到一个日志中,以备查看。

1# crontab -l
21 0 * * * /opt/shell/nginx_cache_hit >> /usr/local/nginx/logs/hit

访脚本的内容为:

1#!/bin/bash
2LOG_FILE='/usr/local/nginx/logs/access.log.1'
3LAST_DAY=$(date +%F -d "-1 day")
4awk '{if($NF==""HIT"") hit++} END {printf "'$LAST_DAY': %d %d %.2f%n", hit,NR,hit/NR}' $LOG_FILE