例如:-
"Bertug 'here multiple blanks' Mete" => "Bertug Mete"
至
"Bertug Mete"
输入从.xls文件中读取.我尝试过使用split()但它似乎没有按预期工作.
import pandas as pd , string , re
dataFrame = pd.read_excel("C:\\Users\\Bertug\\Desktop\\example.xlsx")
#names1 = ''.join(dataFrame.Name.to_string().split())
print(type(dataFrame.Name))
#print(dataFrame.Name.str.split())
让我知道我在哪里做错了.
解决方法:
我认为使用替换:
df.Name = df.Name.replace('\s+', ' ', regex=True)
样品:
df = pd.DataFrame({'Name':['Bertug Mete','a','Joe Black']})
print (df)
Name
0 Bertug Mete
1 a
2 Joe Black
df.Name = df.Name.replace('\s+', ' ', regex=True)
#similar solution
#df.Name = df.Name.str.replace('\s+', ' ')
print (df)
Name
0 Bertug Mete
1 a
2 Joe Black
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。