微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在python中为事件研究创建虚拟变量

如何解决如何在python中为事件研究创建虚拟变量

我有 49 年,从 1970 年到 2018 年,每一年都有一个极性分数(情绪分析)。通过简单回归 (OLS),我想衡量特定年份(1986 年)发生的事件对极性分数的影响。

数据示例:

      Polarity
1970  0.051859
1971  0.053490
1972  0.074705
1973  0.069377
1974  0.088141
1975  0.078384
1976  0.067911
1977  0.068354
1978  0.067758
1979  0.075665
1980  0.065912
1981  0.051863
1982  0.059517
1983  0.081379
1984  0.052928
1985  0.110824
1986  0.054214
1987  0.074198
1988  0.059640
1989  0.038797
1990  0.077892

现在我想知道如何添加一个代表 1986 年事件的虚拟变量,以便我可以衡量对因变量的影响:极性。

解决方法

如果您的数据框 (df) 中有一个名为“year”的列,它记录每个事件发生的年份,您可以通过以下方式使用 Pandas:

pd.get_dummies(df,columns=['year'],drop_first=True)

“Dropfirst”确保您省略了回归通常需要的一个虚拟对象。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。