微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

当我读取 .csv 表时,我的数据框中有多个“\t”

如何解决当我读取 .csv 表时,我的数据框中有多个“\t”

我的数据帧分布在多个 .csv 文件中,所以我首先使用了 glob 模块:

import glob
us_files = glob.glob("states*.csv")
us_list = []
for filenames in us_files:
    data = pd.read_csv(filenames)
    us_list.append(data)
us_census_df = pd.concat(us_list)

当我打印表格时:

\t"\tState\tTotalPop\tHispanic\tWhite\tBlack\tNative\tAsian\tPacific\tIncome\tGenderPop"
0   0\t"0\tAlabama\t4830620\t3.7516156462584975%\t...                                      
1   1\t"1\tAlaska\t733375\t5.909580838323351%\t60....                                      
2   2\t"2\tArizona\t6641928\t29.565921052631502%\t...                                      
3   3\t"3\tArkansas\t2958208\t6.215474452554738%\t...     

所以我将数据帧传递到 .csv 文件,然后读取 .csv 文件,因为使用 pd.read_csv 我可以选择 sepdelimiters

us_census_df.to_csv('us_census.csv',sep ='\t')
us_census = pd.read_csv('us_census.csv',sep = '\t',delimiter = ',')   

但是桌子没有改变......

解决方法

用下面的代码试试这个

import glob
import pandas as pd
us_files = glob.glob("states*.csv")
us_list = []
for filenames in us_files:
    us_list.append(pd.read_csv(filenames,sep='\t'))

us_census_df = pd.concat(us_list,ignore_index=True)

检查这个url

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。