如何解决如何对不在训练集中但有数据的用户进行推理推荐系统,SVD
我目前正在开发一个推荐系统,让用户对电影进行评分,然后进行预测。截至目前,我正在使用 Surprise 库 SVD 算法,该算法似乎非常好且有据可查。然而,我遇到了一个问题:我不想为用户的每个评分重新训练整个模型。
我想出的解决方案是使用先前计算的电影因子和用户输入来生成用户因子,但即使我尝试过拟合以 100% 重新创建原始评分,我也无法生成非常准确的用户因子。
到目前为止我使用了两种方法:
我相信第一种方法称为最小二乘法,我只是尝试用这行代码以数学方式计算完美的用户因素:
np.linalg.inv(X.T@X)@(X.T@y) #@ being matrix multiplication and .T transpose
(我在 X 上加了 1 以获得用户偏见并从 Y 中减去电影偏见) 这种方法根本不会重现数据。
我尝试的第二种方法是完全按照 surprise documentation 中描述的方式实现梯度下降,但不改变电影因素。
eui = x.rating - (itemfac[item]@userfac.T + itembias[item] + userbias)
userbias += a*(eui-r*userbias)
userfac += a*(eui*itemfac[item] - r*userfac)
(Do multiple Iterations with a being learning rate and r being regularization)
这种方法有效但不是很准确,我什至无法让它过拟合。
有没有我没有想到的方法,或者在惊喜库中是否有针对此功能的内置函数? 还是我只需要进一步改进其中一种方法?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。