微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pandas.read_csv “意外的数据结束”错误

如何解决Pandas.read_csv “意外的数据结束”错误

我正在尝试使用 pd.read_csv() 读取数据集时出现错误

import pandas as pd

df2 = pd.read_csv("/content/data.txt",sep=" ",header=0,names=['word','label1','label2'],engine="python")

我收到错误

Error: unexpected end of data

During handling of the above exception,another exception occurred:

ParserError                               Traceback (most recent call last)

我的 Data.txt 文件看起来像

n en en
wish en en
very en en
happy en en
b en en
" univ univ
day en en
to en en
u en en
........... univ univ

当我用其他一些标点符号替换这个 " 时,它工作正常。

我该怎么做才能解决这个问题?为什么这个 " 标记会发生这种情况?

解决方法

设置参数引用为3

引用: int 或 csv.QUOTE_* 实例,默认 0

控制每个 csv.QUOTE_* 常量的字段引用行为。使用其中之一 QUOTE_MINIMAL (0)、QUOTE_ALL (1)、QUOTE_NONNUMERIC (2) 或 QUOTE_NONE (3).

示例:

df = pd.read_csv("t.txt",sep=" ",header=0,names=['word','label1','label2'],engine="python",quoting=3)

输出:

          word label1 label2
0         wish     en     en
1         very     en     en
2        happy     en     en
3            b     en     en
4            "   univ   univ
5          day     en     en
6           to     en     en
7            u     en     en
8  ...........   univ   univ

参考:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?