– 编辑我注意到我输入的时间不是我想要的.我将12点之后的时间转换为24小时时间约定.但是,unutbu的答案应该仍然清楚.
– 第二次编辑.我改变了数据以做出更好的例子.
以下是按日期索引的时间序列.我想从start_datetime开始进行聚合,并根据下面的timedelta(9.5小时= 34200秒)继续聚合.
def main():
# start_datetime = datetime.datetime(2013, 1, 1, 8)
# end_datetime = datetime.datetime(2013, 1, 1, 5, 30)
s = pd.Series(
np.arange(2, 10),
pd.to_datetime([
'20130101 7:34:04', '20130101 8:34:08', '20130101 10:34:08',
'20130101 12:34:15', '20130101 13:34:28', '20130101 12:34:54',
'20130101 14:34:55', '20130101 17:29:12']))
print(s)
bar_size = datetime.timedelta(seconds=60*60*9.5)
time_group = pd.Grouper(
freq=pd.timedelta(bar_size), closed='left', label='right')
foobar = s.groupby(time_group).agg(np.sum)
print(foobar)
if __name__ == "__main__":
main()
2013-01-01 09:30:00 5
2013-01-01 19:00:00 39
Freq: 570T, dtype: int64
大熊猫内部决定从午夜开始分组,而不是从早上8:00开始分组.我无法找到一种方法来强制数据帧在上午8:00开始分组.有没有人有使用熊猫功能的解决方案?
解决方法:
使用base = 480将起点移动480分钟(8小时).
单位是几分钟,因为石斑鱼的频率是570T(T,这里,表示分钟):
import datetime
import pandas as pd
def main():
start_datetime = datetime.datetime(2013, 1, 1, 8)
s = pd.Series(
range(8),
pd.to_datetime([
'20130101 8:34:04', '20130101 10:34:08', '20130101 10:34:08',
'20130101 12:34:15', '20130101 1:34:28', '20130101 3:34:54',
'20130101 4:34:55', '20130101 5:29:12']))
bar_size = datetime.timedelta(seconds=60*60*9.5)
time_group = pd.Grouper(freq=bar_size, closed='left', label='right',
base=480)
foobar = s.groupby(time_group).agg(sum)
print(foobar)
if __name__ == "__main__":
main()
产量
2013-01-01 08:00:00 22
2013-01-01 17:30:00 6
Freq: 570T, dtype: int64
在内部,当给pd.Grouper一个频率时,a TimeGrouper
is returned:
In [81]: time_group
Out[81]: <pandas.core.resample.TimeGrouper at 0x7f1499a32198>
因此传递给pd.Grouper的参数实际上传递给pd.TimeGrouper.
In [82]: pd.TimeGrouper?
Init signature: pd.TimeGrouper(self, freq='Min', closed=None, label=None,
how='mean', nperiods=None, axis=0,
fill_method=None, limit=None, loffset=None,
kind=None, convention=None, base=0, **kwargs)
TimeGrouper文档不解释基本参数,但它与df.resample中的含义相同:
In [83]: df.resample?
Parameters
----------
base : int, default 0
For frequencies that evenly subdivide 1 day, the "origin" of the
aggregated intervals. For example, for '5min' frequency, base Could
range from 0 through 4. Defaults to 0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。