我正在使用AWK来读取我的自定义日志文件.格式是这样的:
[12:08:00 +0000] 192.168.2.3 98374 "CONNECT 192.168.2.4:8091 HTTP/1.0" 200
现在,我有AWK(来自bash)设置读取整个日志,分析每一行并抓住包含“CONNECT”的每一行,但是,它不能帮助我发现独特的客户端.
这样做的方法是以某种方式过滤它,以便分析每一行的这一部分:
“CONNECT 192.168.2.4:8091 HTTP / 1.0”
如果有一种方法可以获取日志文件中的所有这些行,那么将它们全部进行比较,只计算类似的行.所以,让我们说,例如:
[12:08:00 +0000] 192.168.2.3 98374 "CONNECT 192.168.2.6:8091 HTTP/2.0" 200 [12:08:00 +0000] 192.168.2.3 98374 "CONNECT 192.168.2.9:8091 HTTP/2.0" 200 [12:08:00 +0000] 192.168.2.3 98374 "CONNECT 192.168.2.2:8091 HTTP/2.0" 200 [12:08:00 +0000] 192.168.2.3 98374 "CONNECT 192.168.2.9:8091 HTTP/2.0" 200
在这种情况下,我需要的答案是3,而不是4.因为2行是相同的,所以只有3个唯一的行.我需要的是使用AWK实现此目的的自动化方法.
如果有人能伸出援助之手会很棒.
解决方法
原文地址:https://www.jb51.cc/linux/399326.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。