我有一个文件,其模式如下,重复多次:

<Content>Un relax en el ritmo trepidante de New York   showReview(14443615, 'full');
<Date>Mar 22, 2008
<Overall rating>3
<No. Reader>-1
<No. Helpful>-1
<Overall>5

所以我试着在不计算<Overall>的情况下计算<Overall rating>的发生次数。然后我想对每个<Overall>标记后面的数字求和。这是我的密码。
 awk -F'>' '$1=="<Overall" BEGIN{}
    {
        count++
        sum+=$2
    }
    END{printf "%.2f\n", sum/count}' *filename*

最佳答案

另一种方法

$ awk -F'<Overall>' 'NF==2 {sum+=$2; c++}
                     END   {print (c?sum/c:0)}' file

09-09 21:04