Linux中如何统计某个字符串个数？

2021-12-23 18:22:05

在 Linux 系统下，有时候，我们可能要对一个日志文件进行分析。比如，分析日志文件中某个单词或者某个特殊字符串出现了多少次。

对于匹配统计，一般用到正则方法，下面总结了几个统计字符串个数的方法。

grep -o '字符串' file |wc -l

awk -v RS="@#$j" '{print gsub(/字符串/,"&")}' file

awk  '{s+=gsub(/字符串/,"&")}END{print s}' file

备注：上面的 file 是要统计的文件名。上面的字符串换成你具体要统计的内容。

awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。

简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。

假设现在一个文件里面的内容如下：

[root@ihh logs]# cat test.txt 
userid:121212
userid:232323
userid:3434
username:3434
username:4343

[root@ihh logs]# grep -o 'userid' test.txt |wc -l
3

[root@ihh logs]# awk -v RS="@#$j" '{print gsub(/userid/,"&")}' test.txt 3

[root@ihh logs]# awk '{s+=gsub(/userid/,"&")}END{print s}' test.txt 3

码农公寓