我有多个列的制表符分隔文件。我想计算文件夹中所有文件的列中不同值的出现频率,并按计数的降序排列(最高计数首先)。我如何在Linux命令行环境中实现这一点?
它可以使用任何常用的命令行语言,如awk,perl,python等。
要查看第二列的频次计数(例如):
awk -F '\t' '{print $2}' * | sort | uniq -c | sort -nr
fileA.txt
z z a a b c w d e
fileB.txt
t r e z d a a g c
fileC.txt
z r a v d c a m c
结果:
3 d 2 r 1 z 1 m 1 g 1 b
原文地址:https://www.jb51.cc/bash/391281.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。