Nginx 日志统计分析常用命令

1、IP相关统计

1.1 统计IP访问量(独立ip访问数量)

1
awk '{print $1}' access.log | sort -n | uniq | wc -l

1.2 查看某一时间段的IP访问量(4-5点)

1
grep "07/Apr/2017:0[4-5]" access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l

1.3 查看访问最频繁的前100个IP

1
awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 100

1.4 查看访问100次以上的IP

1
awk '{print $1}' access.log | sort -n |uniq -c |awk '{if($1 >100) print $0}'|sort -rn

1.5 查询某个IP的详细访问情况,按访问频率排序

1
grep '127.0.01' access.log |awk '{print $7}'|sort |uniq -c |sort -rn |head -n 100

2、页面访问统计

2.1 查看访问最频的页面(TOP100)

1
awk '{print $7}' access.log | sort |uniq -c | sort -rn | head -n 100

2.2 查看访问最频的页面(排除php页面

1
grep -v ".php"  access.log | awk '{print $7}' | sort |uniq -c | sort -rn | head -n 100

2.3 查看页面访问次数超过100次的页面

1
cat access.log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less

2.4 查看最近1000条记录,访问量最高的页面

1
tail -1000 access.log |awk '{print $7}'|sort|uniq -c|sort -nr|less

2.5 每秒请求量统计

统计每秒的请求数,top100的时间点(精确到秒)

1
awk '{print $4}' access.log |cut -c 14-21|sort|uniq -c|sort -nr|head -n 100

2.6 每分钟请求量统计

统计每分钟的请求数,top100的时间点(精确到分钟)

1
awk '{print $4}' access.log |cut -c 14-18|sort|uniq -c|sort -nr|head -n 100

2.7 每小时请求量统计

统计每小时的请求数,top100的时间点(精确到小时)

1
awk '{print $4}' access.log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 100

3、性能分析

在nginx log中最后一个字段加入$request_time

列出传输时间超过 3 秒的页面,显示前20条

1
cat access.log|awk '($NF > 3){print $7}'|sort -n|uniq -c|sort -nr|head -20

列出php页面请求时间超过3秒的页面,并统计其出现的次数,显示前100条

1
cat access.log|awk '($NF > 1 &&  $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

4、蜘蛛抓取统计

统计蜘蛛抓取次数

1
grep 'Baiduspider' access.log |wc -l

统计蜘蛛抓取404的次数

1
grep 'Baiduspider' access.log |grep '404' | wc -l

5、TCP连接统计

查看当前TCP连接数

1
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l

用tcpdump嗅探80端口的访问看看谁最高

1
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr

查看Nginx错误日志502 503 504报错

1
2
3
awk '$9 = 502 { print $0 }'  access.log
awk '$9 = 503 { print $0 }' access.log
awk '$9 = 504 { print $0 }' access.log

Linux下查看Web服务器当前的并发连接数和TCP连接状态

方法1:

1
netstat -pnt | grep :80 | wc -l

方法2:

1
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

方法3:

1
2
3
4
5
6
7
8
9
10
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(key in S) print key,"\t",S[key]}'

FIN_WAIT2 38
CLOSING 3
SYN_RECV 1
CLOSE_WAIT 1
TIME_WAIT 261
ESTABLISHED 71
LAST_ACK 2
FIN_WAIT1 9

TCP连接的各个状态含义描述如下:

状态含义
CLOSED无连接是活动的或正在进行
LISTEN服务器在等待进入呼叫
SYN_RECV一个连接请求已经到达,等待确认
SYN_SENT应用已经开始,打开一个连接
ESTABLISHED正常数据传输状态/当前并发连接数
FIN_WAIT1应用说它已经完成
FIN_WAIT2另一边已同意释放
ITMED_WAIT等待所有分组死掉
CLOSING两边同时尝试关闭
TIME_WAIT另一边已初始化一个释放
LAST_ACK等待所有分组死掉
ESTABLISHED参数后面的值就是当前系统的并发连接数了
-------------本文结束感谢您的阅读-------------