微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何按不同大小的组执行线性回归?

如何解决如何按不同大小的组执行线性回归?

我有两张桌子。

表 A 有 105 行:

           bbgid            dt  weekly_price_per_stock  weekly_pct_change
0   BBG000J9HHN8    2018-12-31               13562.328           0.000000
1   BBG000J9HHN8    2019-01-07               34717.536           1.559851
2   BBG000J9HHN8    2019-01-14               28300.218          -0.184844
3   BBG000J9HHN8    2019-01-21               35370.134           0.249818
4   BBG000J9HHN8    2019-01-28               36104.512           0.020763
... ... ... ... ...
100 BBG000J9HHN8    2020-11-30               62065.827           0.278765
101 BBG000J9HHN8    2020-12-07               62145.445           0.001283
102 BBG000J9HHN8    2020-12-14               63516.146           0.022056
103 BBG000J9HHN8    2020-12-21               51283.187          -0.192596
104 BBG000J9HHN8    2020-12-28               51306.951           0.000463

表 B 有 257970 行:

               bbgid            dt    weekly_price_per_stock    weekly_pct_change
0       BBG000B9WJ55    2018-12-31                 34.612737             0.000000
1       BBG000B9WJ55    2019-01-07                 70.618471             1.040245
2       BBG000B9WJ55    2019-01-14                 89.123337             0.262040
3       BBG000B9WJ55    2019-01-21                 90.377643             0.014074
4       BBG000B9WJ55    2019-01-28                 90.527678             0.001660
... ... ... ... ...
257965  BBG00YFR2NJ6    2020-12-21                 30.825000            -0.251275
257966  BBG00YFR2NJ6    2020-12-28                 40.960000             0.328792
257967  BBG00YM46B38    2020-12-14                  0.155900            -0.996194
257968  BBG00YM46B38    2020-12-21                  0.372860             1.391661
257969  BBG00YM46B38    2020-12-28                   0.535650            0.436598

在表 A 中只有一组股票 (CCPM),但在表 B 中我有很多不同的股票组。我想对表 B pct_change 与表 A (CCPM) pct_change 进行线性回归,这样我就可以知道表 B 中的股票在{{{ {1}} 列。问题是我在表 A 中只有 105 行,当我按 dt 对表 B 进行分组时,我总是得到更多的行,所以我有一个错误,说 X 和 y 必须是相同的大小。

这两个表之前都按周分组,并且它们的 bbgid 是每周计算的。我应该比较表 B 中 pct_change 和表 A 中的变化,基于日期和一次一组来自表 B 与 CCPM 股票的 pct_change

我想从每个回归中提取斜率并将它们存储在同一个表内的一列中,并将其关联到相应的组。

我已经尝试了 this 个帖子和 this 个帖子中的解决方案,但没有成功。

是否有任何解决方法可以做到这一点,或者我做错了什么?请帮我解决这个问题。

非常感谢您。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。