如何解决如果将dask dataframe列的数据类型转换为integer
我正在处理大型数据集。为了更快地进行处理,我正在使用快速数据帧。
当我将dask数据帧的一列转换为整数,然后尝试打印该dask数据帧的几条记录时,出现以下错误:
ValueError: Cannot convert non-finite values (NA or inf) to integer
转换列的数据类型很常见。因此,对我来说,了解导致此错误的原因很重要。
下面我读了文件
import dask.dataframe as dd
shipment = dd.read_csv(r'C:\Projects\data\Shipment.csv',dtype={'Deal ID': 'float64'})
将“大交易标识符”字段的数据类型更改为整数
shipment['Big Deal Identifier']=shipment['Big Deal Identifier'].astype(int)
然后我尝试打印一些记录
shipment.head(n=5)
这是当我遇到以下错误
ValueError: Cannot convert non-finite values (NA or inf) to integer
现在,如果我不尝试将“大交易标识符”列更改为整数, 然后我可以使用以下代码打印一些记录,而不会出现任何错误
shipment.head(n = 3)
我不明白,当我尝试将列的数据类型更改为整数(步骤1)然后尝试打印(步骤2)时,为什么会出现错误。我在步骤2中遇到错误。但是,当我运行代码以在不更改数据类型的情况下进行打印时,它将打印出来。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。