Shell脚本实现apache日志中的状态码分析

一、首先将apache日志按天切割

       vi /etc/httpd/conf/httpd.conf
        ErrorLog "|rotatelogs /var/log/httpd/%Y%m%derror_log 86400 480"
       CustomLog "|rotatelogs /var/log/httpd/%Y%m%daccess_log 86400 480" combined

二、重启apache服务

       service httpd restart

##################apahce日志服务器按天切割完毕######################

三、分析生成的apache日志状态码(等待了一天的日志)

       ***日志文件为20111228access_log
       vi http.sh
       #!/bin/bash
       total=`cat 20111228access_log|wc -l`
      array=(`cat 20111228access_log |awk '{print $9}'|sort|uniq -c|sort -n`)
      len=${#array[@]}
      echo "####################http状态码统计###########################"
      echo "总的连接数:$total"
             for ((i=0;i<$len;i=i+2))
                {
                   echo "########################################################"
                           echo ${array[$i]}:${array[$i+1]}
                   echo "########################################################"
                            echo ${array[$i+1]}占连接数的比例是:`awk 'BEGIN{printf "%.6f%n",('${array[$i]}'/'${total}'*100)}'`
                 }

执行脚本结果(以百分号表示):

sh http.sh 
####################http状态码统计###########################
总的连接数:688965
########################################################
1:303
########################################################
303占连接数的比例是:0.000145%
########################################################
1:416
########################################################
416占连接数的比例是:0.000145%
########################################################
2:299
########################################################
299占连接数的比例是:0.000290%
########################################################
8:501
########################################################
501占连接数的比例是:0.001161%
########################################################
145:403
########################################################
403占连接数的比例是:0.021046%
########################################################
197:400
########################################################
400占连接数的比例是:0.028594%
########################################################
738:206
########################################################
206占连接数的比例是:0.107117%
########################################################
7307:404
########################################################
404占连接数的比例是:1.060576%
########################################################
9213:302
########################################################
302占连接数的比例是:1.337223%
########################################################
30574:301
########################################################
301占连接数的比例是:4.437671%
########################################################
201197:304
########################################################
304占连接数的比例是:29.202790%
########################################################
439582:200
########################################################
200占连接数的比例是:63.803241%
########################简单讲解#########################
array=(`cat 20111228access_log |awk '{print $9}'|sort|uniq -c|sort -n`)
  ###这个拿出来是一个数组了
len=${#array[@]}
 ###这个是数组的长度
echo ${array[$i]}:${array[$i+1]}
###这个是以for循环输入状态码和状态码的连接数
awk 'BEGIN{printf "%.6f%n",('${array[$i]}'/'${total}'*100)}
###以百分比计算各个状态码大约占的连接数