微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何解释系数显着p值接近零且R2接近零的模型?

如何解决如何解释系数显着p值接近零且R2接近零的模型?

给那里的统计专家: 考虑回归的解释让我头疼。

如果测试异常,则可以通过在回归中使用虚拟变量D来解决。 假设您想确定某一天的反应是否正常。因为我们有感觉,我们在星期五赚了更多的钱。回归看起来像:

返回/收益= a + b1 DMonday + b2 DTuesday + b3 DWednesday + b4 DThursday + b5 Driday + e

请确保您的收入取决于其他因素,例如客户数量,价格水平,天气情况,...谁知道...

比方说,b5的p值接近零。但是R2也为零。如何解释这个结果?

说整个模型无法预测收益,因为R2为零!?我感觉合理。 另一方面,我可以说星期五比其他日子明显好。对我来说也很有意义。

但是我不明白为什么,如果星期五很重要,那么整个模型的R2接近于零。 我知道有些人使用ANOVA和Kruskal Wallis。但是我知道回归经常被使用。我只是不明白背后的想法。 任何解释将不胜感激。

PS:补充-为什么有些人在回归中放弃星期一?好的,在这种情况下,星期一作为参考。我能理解但是这样做的好处是什么?结果不一样吗?

解决方法

摘要

  • p-value较低表示统计意义,在这种情况下,这意味着预测变量与目标变量之间呈线性相关性
  • R2得分用于衡量模型在给定预测变量值的情况下精确测量目标变量的能力
  • p值和r2值较低,因为它们在线性回归中测量不同的指标

PS:补充-为什么有些人在回归中放弃星期一?好的,在这种情况下,星期一作为参考。我能理解但是这样做的好处是什么?结果不一样吗?

星期一用作参考,并且是多余的。通过删除一个变量,还降低了分析的复杂性。关于伪变量,有一篇更好的文章,您可以阅读here

说明

线性回归模型的p-value检查预测变量(在本例中为星期一至星期五)与目标变量(收益/收益)之间是否存在显着的线性关系或相关性。如果p值较低,则表示其关系很重要。这意味着响应变量随着系数或预测变量的增加或减少而增加或减少。

如果r2 score接近于0,则表示该模型无法解释您数据的大部分可变性。这意味着平均而言,当您使用任何值预测收益/收益值时,它都不太可能接近最佳拟合线。

比方说,b5的p值接近零。但是R2也为零。 如何解释这个结果?

b5的p值接近零,表示Friday具有目标变量significant linear relationship的{​​{1}}。这不一定意味着我们能够精确地预测我们的价值。

例如,请参考下面从here收集的图像

enter image description here enter image description here

我们可以清楚地看到,认为变量之间存在显着的线性相关性,与点围绕最佳拟合线居中的第二个图相比,点围绕最佳拟合线的图的R2值较低

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。