如何解决根据另一列和关键字列表之间的相似性创建 Dataframe 列
keywords = ['volkswagon','boeing','audi']
我想计算此列表与包含类似单词(例如“BMW”或“Opel”)的数据框列之间的相似度得分,并将得分最高的单词放入新列中。我尝试了以下方法:
def brand_match(data):
keywords = ['volkswagon','audi']
brands = difflab.get_close_matches(data,keywords,n=1,cutoff=0.6)
return brands[0] if brands else ''
df['brands'] = df['words'].apply(brand_match)
但是 df['brands'] 返回为空。任何人都可以提出更好的方法吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。