微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 将Pandas Column转换为DateTime II

我试图将DateTime字符串列转换为Pandas可理解的日期时间格式.当然,我已经谷歌搜索并尝试了几种解决方案.
Convert Pandas Column to DateTime

这个对我来说似乎是最令人鼓舞的,但两种推荐的方式对我的数据集都不起作用.
细节:
数据集名称:co,

列:索引列,

格式:15.07.2015 24:00,之前或之后不再有空白.

我的努力:

co['newdate'] = pd.to_datetime(co.index, format='%d.%m.%Y %H:%M')

在我将Index-col转换为名为“Datum”的“普通”列后,我尝试了下一个

co['newdate'] = co['Datum'].apply(lambda x: dt.datetime.strptime(x,'%d.%m.%Y %H:%M'))

错误:时间数据’15 .07.2015 24:00’与格式’%d.%m.%Y%H:%M’不匹配

两种解决方案都会出现此错误.有人有想法吗?

解决方法:

您的格式字符串是正确的,但您的数据不是,24不是有效的小时组件,因此错误

In [138]:

pd.to_datetime('15.07.2015 24:00', format = '%d.%m.%Y %H:%M')
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
C:\WinPython-64bit-3.4.3.5\python-3.4.3.amd64\lib\site-packages\pandas\tseries\tools.py in _convert_listlike(arg, Box, format)
    329             try:
--> 330                 values, tz = tslib.datetime_to_datetime64(arg)
    331                 return DatetimeIndex._simple_new(values, None, tz=tz)

pandas\tslib.pyx in pandas.tslib.datetime_to_datetime64 (pandas\tslib.c:23823)()

TypeError: Unrecognized value type: <class 'str'>

During handling of the above exception, another exception occurred:

ValueError                                Traceback (most recent call last)
<ipython-input-138-1546fb6950f0> in <module>()
----> 1 pd.to_datetime('15.07.2015 24:00', format = '%d.%m.%Y %H:%M')

C:\WinPython-64bit-3.4.3.5\python-3.4.3.amd64\lib\site-packages\pandas\tseries\tools.py in to_datetime(arg, errors, dayfirst, utc, Box, format, exact, coerce, unit, infer_datetime_format)
    343         return _convert_listlike(arg, Box, format)
    344 
--> 345     return _convert_listlike(np.array([ arg ]), Box, format)[0]
    346 
    347 class DateParseError(ValueError):

C:\WinPython-64bit-3.4.3.5\python-3.4.3.amd64\lib\site-packages\pandas\tseries\tools.py in _convert_listlike(arg, Box, format)
    331                 return DatetimeIndex._simple_new(values, None, tz=tz)
    332             except (ValueError, TypeError):
--> 333                 raise e
    334 
    335     if arg is None:

C:\WinPython-64bit-3.4.3.5\python-3.4.3.amd64\lib\site-packages\pandas\tseries\tools.py in _convert_listlike(arg, Box, format)
    305                     try:
    306                         result = tslib.array_strptime(
--> 307                             arg, format, exact=exact, coerce=coerce
    308                         )
    309                     except (tslib.OutOfBoundsDatetime):

pandas\tslib.pyx in pandas.tslib.array_strptime (pandas\tslib.c:39900)()

ValueError: time data '15.07.2015 24:00' does not match format '%d.%m.%Y %H:%M' (match)

而23:59将解析罚款

In [139]:
pd.to_datetime('15.07.2015 23:59', format = '%d.%m.%Y %H:%M')

Out[139]:
Timestamp('2015-07-15 23:59:00')

您需要将0替换为0才能进行解析:

In [140]:
pd.to_datetime('15.07.2015 00:00', format = '%d.%m.%Y %H:%M')

Out[140]:
Timestamp('2015-07-15 00:00:00')

所以你可以做的是调用vectorised str.replace来修复这些错误的小时值:

In [144]:
df = pd.DataFrame({'date':['15.07.2015 24:00']})
print(df)
df['date'] = df['date'].str.replace('24:','00:')
print(df)
pd.to_datetime(df['date'], format = '%d.%m.%Y %H:%M')

               date
0  15.07.2015 24:00
               date
0  15.07.2015 00:00
Out[144]:
0   2015-07-15
Name: date, dtype: datetime64[ns]

所以在你的情况下你可以这样做:

co.index = co.index.str.replace('24:','00:')

然后像以前一样转换

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐