如何解决Pandas 操作将 dtype: timedelta64[ns] 更改为 dtype: object
我正在计算 Pandas 数据框中的时间差,以便我可以对这些时间差求和。这是我执行此操作的完整代码:
temp['ACCESS_TIME'] = pd.to_datetime(temp['ACCESS_TIME'])
temp = temp.sort_values(['ID','ACCESS_TIME'])
temp['TIME_DIFFERENCE'] = temp.groupby(['ID'])['ACCESS_TIME'].diff()
oneMin = temp.copy()
oneMin.loc[(oneMin.TIME_DIFFERENCE > '00:01:00'),'TIME_DIFFERENCE'] = '00:01:00'
oneMin['DURATION'] = oneMin.groupby(['ID'])['TIME_DIFFERENCE'].transform('sum')
在第三行之后,一个简单的“temp['TIME_DIFFERENCE']”显示了数据类型:timedelta64[ns]。但是在第 5 行之后,打印 "oneMin['TIME_DIFFERENCE']" 显示 dtype: object。这会在尝试第 6 行时导致错误,其中指出:“+ 不支持的操作数类型:‘int’和‘timedelta’”。我真的不知道发生了什么。
问题是我想将时差限制在 1 分钟。在我用这条线消除 1 分钟的时差之前:
oneMin = oneMin[oneMin['TIME_DIFFERENCE'] < '00:01:00']
这完全没问题。但我不想在一分钟内删除这些值,我想在一分钟内限制它们。
解决方法
问题是您将“TIME_DIFFERENCE”列的某些值设置为字符串“00:01:00”。您可能想要做的是将代码中的第五行替换为
oneMin.loc[(oneMin.TIME_DIFFERENCE > '00:01:00'),'TIME_DIFFERENCE'] = pd.Timedelta('00:01:00')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。