如何解决在为多种类型的产品创建推荐系统时,您如何处理隐式评分中的偏差?
在为零售业务做推荐系统(协同过滤)时,没有实际评分(例如对项目满意 1-10)。
因此,我不使用。每个用户购买某个项目作为隐式评分的次数。但是,这样做可能会在缓慢移动的产品(例如电视)和快速移动的产品(例如薯条、零食)之间产生偏差。客户购买滞销产品的次数远远少于滞销产品。
我的问题是:
感谢您提前回答!
解决方法
尝试回答您的具体问题:
-
是的,但这取决于您掌握的有关这些物品的其他信息。我试图回答做出一些合理的假设。
-
我可以假设你有这件物品的费用。您可以按项目的成本进行标准化,以确保减少(不是完全消除)偏差。您可以进行直接归一化 (
weighted_rating = implicit_rating * cost per item
)。在这里,cost_per_item
服务于weights
的目的,以减少偏差。或者,您可以通过binning
或clustering
所有商品的价格来试验价格组,以形成产品组,从而为您提供group_mean_price
。然后可以将其用作权重。
如果您了解有关该物品的其他信息(例如易腐烂/易耗品/笨重),您可以拥有更多具有代表性的聚类。此后,您可以为每个项目分配 implicit_rating
。现在,您可以通过使用组评分的汇总统计数据(例如 implicit_rating
)来标准化每个 group_mean_implicit_rating
。所以,weighted_rating = implicit_rating/group_mean_implicit_rating
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。