python – 在colaboratory中从驱动器加载xlsx文件

如何从谷歌驱动器导入MS-excel(.xlsx)文件到colaboratory?

excel_file = drive.CreateFile({'id':'some id'})

确实有效(驱动器是pydrive.drive.GoogleDrive对象).但,

print excel_file.FetchContent()

返回无.和

excel_file.content()

抛出:

TypeErrorTraceback (most recent call last)
in ()
—-> 1 excel_file.content()

TypeError: ‘_io.BytesIO’ object is not callable

我的意图是(给定一些有效的文件’id’)将其作为io对象导入,可以通过pandas read_excel()读取,最后从中获取pandas数据帧.

解决方法:

您将要使用excel_file.GetContentFile在本地保存文件.然后,你可以使用Pandas read_excel方法!pip install -q xlrd.

这是一个完整的例子:
https://colab.research.google.com/notebook#fileId=1SU176zTQvhflodEzuiacNrzxFQ6fWeWC

我做的更详细:

我创建了一个新的spreadsheet in sheets作为.xlsx文件导出.

接下来,我将其导出为.xlsx文件并再次上传到云端硬盘. URL是:
https://drive.google.com/open?id=1Sv4ib5i7CKWhAHZkKg-uitIkS3xwxtXM

记下文件ID.就我而言,它是1Sv4ib5i7CKWhAHZkKg-uitIkS3xwxtXM.

然后,在Colab中,我调整了Drive download snippet来下载文件.关键位是:

file_id = '1Sv4ib5i7CKWhAHZkKg-uitIkS3xwxtXM'
downloaded = drive.CreateFile({'id': file_id})
downloaded.GetContentFile('exported.xlsx')

最后,创建一个Pandas DataFrame:

!pip install -q xlrd
import pandas as pd
df = pd.read_excel('exported.xlsx')
df

!pip install …行安装xlrd库,这是读取Excel文件所必需的.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐