微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何通过python确定.tsv文件的形状

如何解决如何通过python确定.tsv文件的形状

我有一个 .tsv 文件,看起来像这样 .tsv File structure in MSExcel

我想通过pytorch确定它的形状。我该怎么做

我写了一段代码

将熊猫导入为 pd

df = pd.read_csv(path/to/.tsv)

df.shape

然后输出

(13596,1)

但显然形状与我提供的图像相冲突。我做错了什么?

解决方法

使用pd.read_csv时需要指定数据的分隔方式(除非是逗号分隔的)

df = pd.read_csv(path/to/.tsv,sep = '\t')

应该正确加载数据。

见:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html

编辑:查看您的数据时,您还应该指定 header=None,因为您没有标题行。理想情况下,还使用 ​​names

pd.read_csv 参数提供列名列表 ,

问题是您缺少分隔符属性

import pandas as pd

df = pd.read_csv("data/test.txt")
print(df.shape)

输出:(2,1)

import pandas as pd

df = pd.read_csv("data/test.txt",sep='\t')
print(df.shape)

输出:(2,3)

所以请将 sep='\t' 添加到您的 read_csv

另外如果你有一个header,你可以通过header=0

pd.read_csv("data/test.txt",sep='\t',header=0)

如果有帮助请告诉我

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。