如何解决Python中的特定近似匹配
问题
我想在Python中实现一种具体的近似匹配两个句子的方式。
示例-
s_1 = "I hope you are safe from COVID-19 today"
s_2 = "I hope you're safe from COVID 19 today"
score = get_similarity(s_1,s_2)
OR
s_1 = "I allow account access to facebook"
s_2 = "I allow an account access to face book"
score = get_similarity(s_1,s_2)
APPROACH
我尝试使用fuzzywuzzy
来获得部分匹配比率,但是我观察到,即使s_2
是"I allow an account access to
,而没有face book
时,它也会将会获得很高的相似度得分。
询问
有没有更好的方法,这样我就可以考虑整个句子的相似性了?
注意-s_2
可能是视频文件的转录,也可能不是,因此在获取精确文本时必须考虑该增量。例如FACEBOOK can be transcribed as FACE BOOK
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。