如何解决路径对于StringIO而言太长,但对于文本而言
我想使用StringIO而不是文本文件将数据复制到熊猫数据框。有些文件会很大,我宁愿没有大的文本文件然后删除。使用StringIO似乎是一个更好的解决方案。
如果执行此操作,则不会创建数据框
import pandas as pd
import requests
indindustryDataURL='https://download.bls.gov/pub/time.series/pc/pc.industry' #0.04MB
# put data from web into a requests.get() object
indindustryData=requests.get(indindustryDataURL,allow_redirects=True)
# Store column names and data rows from requests.get() in separate list objects
industryDataColNames=indindustryData.text.split('\r\n')[0].split('\t')
industryDaTarowData=indindustryData.text.split('\r\n')[1:-1]
# Print row data into a text file ready for import pandas like csv
with open('industryDaTarowData.txt','w') as f:
f.writelines('%s\n' % row for row in industryDaTarowData )
#This works fine
df1=pd.read_csv('industryDaTarowData.txt',sep='\t',names=industryDataColNames)
但是当我在同一jupyter笔记本上尝试下面的代码StringIO()时,由于关于路径的错误太长,它不会让我进入。
import io
io = io.StringIO()
start_time = datetime.Now()
io.writelines(industryDaTarowData)
io.seek(0)
df2=pd.read_csv(io.getvalue(),names=industryDataColNames)
ValueError:统计:Windows路径太长
有什么建议吗?
解决方法
您传递的是缓冲区,而不是缓冲区的内容。
df2=pd.read_csv(io,sep='\t',...)
,
尝试:
df2=pd.read_csv(io.getvalue().strip(),names=industryDataColNames)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。