如何解决标准化字符串列表的最佳方法
我正在编写一个使用 fuzzywuzzy 规范化列表 o 字符串的脚本。我的目标是使每个字符串与另一个相同的字符串具有 95% 或更高的相似度,如下所示:
原始列表:['Python 脚本'、'python3 脚本'、'汽车隐藏'、'我的汽车隐藏'、'汽车'、'文档'、'文档']
结果:['Python 脚本'、'Python 脚本'、'汽车隐藏'、'汽车隐藏'、'汽车隐藏'、'文档'、'文档']
为此,我用 Python 编写了一个脚本,执行以下步骤
有没有更好的方法?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。