如何解决从 csv (pandas) 读取数据
我有两张桌子:
reference_id | 排他性 |
---|---|
0047465 | 奢华 |
0165797 | 奢华 |
0013286 | 选择性 |
BB010 | 选择性 |
ticket-reference_id | product-reference_id |
---|---|
2017010105521000016V | 47465 |
2017010105521000090V | 165797 |
2017010105521000111V | 13286 |
2017010105521000111V | BB010 |
对于这两个表,我都使用了代码:
pd.read_csv('df1.csv',sep = ';')
pd.read_csv('df2.csv',sep = ';')
但是在第二个表中的 product_reference_id 列中缺少零。 product_reference_id 和 reference_id 列中的值必须相同。这样我就可以加入两个表。
解决方法
您确定 CSV 本身具有前导 0 吗?您能否粘贴与数据框表中的行相对应的每行的第一行?
假设 CSV 本身都有 0,那么您只需要将这些列作为字符串读取。由于看起来两个 CSV 中的两个列都是字符串 y,因此您可以像这样读取它们:
pd.read_csv('df1.csv',dtype=str,sep=';')
pd.read_csv('df2.csv',sep=';')
如果您想将某些列作为其他数据类型读入,您可以使用 dict for dtype 与各个列和类型。有关信息,请参阅 the pandas docs for read_csv。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。