如何解决预测表明准确度太低
我通过销售价格、浏览量和运费来估算销售额。该数据使用来自真实在线购物中心的数据。所有这些数据异常都已被删除。
但是,问题是使用回归、随机森林、KNN等模块时准确率太低。结果不就是解释了销售价格、观看次数和运费都不是决定销量的因素吗?
result10 = pd.read_csv('result10.csv')
result10.head() # (170,4) data
价格 | 查看 | 运费 | 音量 | |
---|---|---|---|---|
0 | 5330 | 279 | 3000 | 5 |
1 | 4200 | 681 | 3000 | 18 |
2 | 6000 | 1456 | 4000 | 39 |
3 | 10000 | 445 | 2500 | 7 |
4 | 10420 | 304 | 3000 | 4 |
import statsmodels.api as sm
import statsmodels.formula.api as smf
feature_names = result10.columns.to_list()
feature_names.remove('volume')
model = sm.OLS.from_formula("volume ~ "+"+".join(feature_names),data = result10)
res = model.fit()
print(res.summary())
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。