微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从 Java 文本文件中查找短语

如何解决从 Java 文本文件中查找短语

目标是我正在阅读文本文件并找到要替换的某些单词。然后它将替换单词并输出一个替换单词的新文本文件。我的代码适用于单个单词,但如果我尝试用空格替换短语,则不起作用。我拥有的是一个 HashMap,其中包含我需要在文件搜索内容

 HashMap<String,Integer> hm = new HashMap<>();

            hm.put("null",0);
            hm.put("max",1);
            hm.put("Do not repeat",2);
            hm.put("names",3);

然后我遍历 HashMap 并用单词替换字符串(如果文件包含它)。

                    for (String key : hm.keySet()) {
                        String check = key;
                        System.out.println(check);

                        text = text.toLowerCase(Locale.ROOT).replaceAll(check,"WRONG");
                    }
                    String new = text;

如果我在“不要重复”之类的词中有空格,这将不起作用。我怎样才能让它适用于短语而不仅仅是单个单词?它完全跳过短语并输出仅替换单个单词的新文件

解决方法

这与空格无关,而是因为大写的 D。

text.toLowerCase(Locale.ROOT)

将生成一个仅包含小写字母的字符串,因此在其中找不到 "Do not repeat"

您可以通过传递 the appropriate flag 使 replaceAll 不区分大小写:

text = text.replaceAll("(?i)" + check,"WRONG");

请注意,您可能会在搜索的字符串中遇到元字符问题。如果您可能包含带有例如的东西句号 (.),您应该引用 check:

text = text.replaceAll("(?i)" + Pattern.quote(check),"WRONG");

此外,因为您没有考虑单词边界,所以您可能会遇到 Scunthorpe problem

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。