如何解决如何使用SVD构建用于协同过滤RS的数据集?
我正在尝试使用 SVD 来预测 RS 评级。我想从一个小数据集开始,以便清楚地看到过程,并且在构建数据集时遇到问题
user_id=[1,1,2,3,3]
movie_id=[1,4,5,5]
rating=[1,'']
reviews={'movie_id':movie_id,'user_id':user_id,'rating':rating}
reviews_df= pd.DataFrame(reviews,columns=['user_id','movie_id','rating'])
df 为:
- 然后将它们拆分为
df_train = reviews_df.head(9)
df_test = reviews_df.iloc[9:12,:]
图片如下:
- 查找训练和测试电影和用户 ID
train_idx = np.array(user_item_train.index)
train_movie = np.array(user_item_train.columns)
test_idx = np.array(user_item_test.index)
test_movie = np.array(user_item_test.columns)
- 然后测试影片和训练影片 intersectld 为空。
test_movie_subset = np.intersect1d(test_movie,train_movie)
如果我是对的,电影的子集是空的,那么它无法预测。
但问题是如果只把电影4的部分评分放在训练中,那么unstack会有nan,也不能使用SVD。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。