如何解决如何使用Fuzzy Wuzzy更改行值?
我正在尝试遍历数据框,并用状态列表中的最佳近似值替换状态名称。
这是我的数据框
Uri2 Count
copy_all 2
delete 3
merge_all 1
select 4
State Homicides
----------------- -------------
Colima 5
Ciudad de Mxico 5
Veracruz Ignacio 7
Hidalto 9
.
.
.
我想做的是检查列状态和我的向量的近似值,并根据给定的向量在df中更改状态的正确名称。
这是我的尝试:
v_correct_states = [ "Aguascalientes","Baja California","Baja California Sur","Campeche","Coahuila".... ]
请有人帮我。
这是我希望的结果
col_list = ["State"]
for filename in sorted(glob.glob(dirname + '/*.csv')):
df = pd.read_csv(filename,usecols=col_list)
for col in df[['State']]:
df[col] = df[col].str.strip()
aprox = process.extractOne(df[col],v_correct_states)
print(aprox)
>>TypeError: expected string or bytes-like object
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。