如何解决使用假期库 -python 根据日期检查是否为假期
我有一个过去 3 年的数据集,我想根据假期添加一个新列。 当我尝试这个时:
import holidays
de_holidays = holidays.DE()
for date,name in sorted(holidays.DE(years=2021).items()):
print(date,name)
我得到了结果
2021-01-01 Neujahr
2021-04-02 Karfreitag
2021-04-05 Ostermontag
2021-05-01 Erster Mai
2021-05-13 Christi Himmelfahrt
2021-05-24 Pfingstmontag
2021-10-03 Tag der Deutschen Einheit
2021-12-25 Erster Weihnachtstag
2021-12-26 Zweiter Weihnachtstag
现在我想在我现有的数据集中用真/假创建一个新列,以防万一。 我尝试使用以下代码片段。
My Date column looks something like this: Dtype is datetime64[ns]
2021-07-22
2021-07-21
2021-07-20
2021-07-19
#I used the code
import holidays
de_holidays = holidays.DE()
df['Holiday'] = df['Date'].isin(de_holidays)
rslt_df
rslt_df.loc[rslt_df['Date'] == '2021-05-13']
我期望的结果是 True,因为 13 日可能是假期,但我意识到这段代码给出了所有错误值。有人可以帮忙吗?
编辑
12390 2021-07-22
12380 2021-07-21
12370 2021-07-20
12360 2021-07-19
12350 2021-07-18
...
40 2018-03-05
30 2018-03-04
20 2018-03-03
10 2018-03-02
0 2018-03-01
Name: Date,Length: 1240,dtype: datetime64[ns]
现在当我使用
df['Holiday'] = df['Date'].isin(holidays.DE(years=2021))
我得到了正确的真/假值,但是一旦我删除了年份选项卡,我就会得到所有的假值
df['Holiday'] = df['Date'].isin(holidays.DE())
解决方法
这可以很好地获取布尔值
from datetime import date
import holidays
de_holidays = holidays.DE()
#date(2021-07-22) in de_holidays
rslt_df['Holiday'] = rslt_df['Date'].isin(holidays.DE(years=[2018,2019,2020,2021]))
rslt_df
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。