如何解决使用两个for循环进行列表比较时的性能优化
我目前正在尝试将一个列表的每个元素与另一个列表的每个元素进行比较。时间复杂度为N * N,这是性能的障碍。
循环如下:
#fin_textt is a list which contains strings
for i in (range(len(fin_textt))):
for j in range(i+1,len(fin_textt)):
if(fuzz.ratio(fin_textt[i],fin_textt[j])<90):
continue
else:
dup.append((fin_textt[i],fin_textt[j]))#all reviews which are very similar and have a value 90 and above
在10k数据集上运行上述代码时,给出输出所花费的时间非常大。 请帮助我优化此设置并提高性能。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。