如何解决Numpy busday_count 不考虑假期
我有一个数据集,我需要计算从给定日期到今天的工作日,不包括给定的假期列表。我将包括周末。
日期示例:
这是我试过的代码:
import pandas as pd
import numpy as np
from datetime import date
df = pd.read_excel('C:\\sample.xlsx')
#get todays date
df["today"] = date.today()
#Convert data type
start = df["R_REL_DATE"].values.astype('datetime64[D]')
end = df["today"].values.astype('datetime64[D]')
holiday = ['2021-06-19','2021-06-20']
#Numpy function to find in between days
days = np.busday_count(start,end,weekmask='1111111',holidays=holiday)
#Add this column to dataframe
df["Days"] = days
df
当我运行这段代码时,它给出了 R_REL_DATE 和今天之间的差异,但不会减去给定的假期。
请帮忙,我想从天数中扣除给定的假期列表。
解决方法
确保 today
和 R_REL_DATE
是带有 pd.to_datetime()
的 Pandas 日期时间格式:
import pandas as pd
import numpy as np
import datetime
df = pd.DataFrame({'R_REL_DATE': {0: '7/23/2020',1: '8/26/2020'},'DAYS IN QUEUE': {0: 338,1: 304}})
df["today"] = pd.to_datetime(datetime.date.today())
df["R_REL_DATE"] = pd.to_datetime(df["R_REL_DATE"])
start = df["R_REL_DATE"].values.astype('datetime64[D]')
end = df["today"].values.astype('datetime64[D]')
holiday = ['2021-06-19','2021-06-20']
#Numpy function to find in between days
days = np.busday_count(start,end,weekmask='1111111',holidays=holiday)
#Add this column to dataframe
df["Days"] = days - 1
df
Out[1]:
R_REL_DATE DAYS IN QUEUE today Days
0 2020-07-23 338 2021-06-27 336
1 2020-08-26 304 2021-06-27 302
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。