如何解决difflib.SequenceMatcher() 的矢量化使用以实现高效处理
我在变量 sample
和变量 strings_to_match
中有一个句子列表,我的目的是按顺序查看每个句子之间是否存在相似性。即获得 sample[0]
和 strings_to_match[0]
之间的相似度分数,直到两个列表中的每个句子。
sample = ['Mary had a little lamb','Jack went up the hill','Jill followed suit','i woke up suddenly','it was a really bad dream']
strings_to_match = ['Mary had a litle lamb','Jack went to the hill','Jill folowed suit','it was a really bad dreem']
这样做的一种方法是
scores = [difflib.SequenceMatcher(None,sample[i],strings_to_match[i]).ratio() for i in range(len(sample)]
但是,除了进行这种循环之外,还有其他有效的矢量化方式来完成这项工作吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。