微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

尾部定界符使大熊猫感到困惑read_csv

如何解决尾部定界符使大熊猫感到困惑read_csv

我创建了一个GitHub问题来看看如何自动处理此问题:

https://github.com/pydata/pandas/issues/2442

我认为FEC文件格式略有变化,从而引起了这一烦人的问题-如果您使用http://github.com/pydata/pydata- book上发布的文件,则希望不会出现此问题。

解决方法

一个csv(以逗号分隔)文件,其中的行带有一个额外的尾随定界符,似乎令人困惑pandas.read_csv。(数据文件为[1])

它将多余的定界符视为存在额外的列。因此,除了标题所需的内容外,还有一列。然后pandas.read_csv将第一列作为行标签。总体效果是,列和标题不再对齐-
第一列成为行标签,第二列由第一个标题命名,依此类推。

这很烦人。知道如何判断正确pandas.read_csv的事情吗?我找不到一个。

很棒的书,顺便说一句。


[1]:《 Python for Data Analysis 》一书第9章中的2012 FEC选举数据库 __

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。