linux – 使用grep过滤掉一个停用词文件中的单词

我想使用grep和一个stopwords文件来过滤掉另一个文件中的常用英语单词.文件“somefile”每行包含一个单词.
cat somefile | grep -v -f stopwords

这种方法的问题是:它检查某些文件中是否出现停用词中的单词,但我想要相反,即检查某些文件中的单词是否出现在停用词中.

这该怎么做?

somefile包含以下内容:

hello
o
orange

停用词包含以下内容:

o

我想从somefile中过滤掉单词“o”,而不是hello和orange.

解决方法

我想了一下,找到了解决方案……

使用grep的-w开关来匹配整个单词:

grep -v -w -f stopwords somefile

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


查找全部容器的日志文件 $ sudo find /var/lib/docker/containers -name *.log 查看日志位置 $ docker inspect --format='{{.LogPath}}' <container_name> 实时查询内容 $
Linux日志文件中列属性的详细解析
在Linux系统中没有duf命令,如何有效地管理磁盘空间?
深入探讨EncryptPad在Linux操作系统中的功能和优势
原理和应用场景:Linux中ttyload工具的工作原理和实际用途
深度解析SELinux的三种策略类型
评估Linux系统性能的ttyload工具使用效果
分享在Linux系统中检测SSH版本的方法
介绍Linux平台上的数据加密工具EncryptPad
在Linux系统中,如何查看和诊断块设备信息?
在Linux环境下如何查看块设备信息?
探索Linux操作系统下的数据加密工具EncryptPad
学会在Linux系统中查看硬盘信息
分析SELinux:原理与实践
掌握SELinux策略类别
技巧:有效解读和管理Linux日志文件
查看Linux系统中的所有用户
了解Linux系统中各种不同类型的日志文件
深入理解Linux PS命令
方法:在Linux操作系统中查看用户