如何解决如何评估基于知识的推荐系统?
我创建了一种算法,可以根据链接的开放数据云中找到的关系推荐与特定电影相关的电影,例如与《终结者》电影相关的电影。它提取在 LinkedMDB 数据集中找到的关系来推荐相似的电影,并根据不同的相似度算法依赖电影名称之间的相似度。因此,该算法生成了如下电影列表(推荐电影)。 ...
http://dbpedia.org/resource/Terminator_2:_Judgment_Day
http://dbpedia.org/resource/The_Abyss
http://dbpedia.org/resource/True_Lies
http://dbpedia.org/resource/Platoon
http://dbpedia.org/resource/Aliens
http://dbpedia.org/resource/Escape_from_New_York
http://dbpedia.org/resource/Hardware_Wars
http://dbpedia.org/resource/No_Escape
http://dbpedia.org/resource/The_6th_Day
http://dbpedia.org/resource/The_Crazies
... 现在我需要评估这些结果并与其他研究进行比较。与初始电影(终结者)相似和相关的前 10 部电影将作为推荐项目展示给用户,该算法是一种基于知识的算法,它不同于依赖评级的协同过滤算法。因此,此任务称为排名任务。 Precision 将非常小,大约只有 0.20 和 Recall 0.01,这件事很有意义,因为我的数据只有 10,它将与 MovieLens 中存在的数千条记录进行比较。我不知道在这种情况下我应该怎么做来评估我的结果,因为我的算法不依赖于评级,我可以像传统算法一样预测未知评级并将其与已知评级进行比较。那么我应该怎么做来评估我的结果呢? 除此之外,我的算法根据初始电影及其特征进行个性化,例如演员和导演的姓名以及用户可能喜欢的其他一些数据。因此,我过滤了 MovieLens 以包含对初始电影(The Terminator)进行评分的所有用户,以查看是否同一用户也对我的算法生成的 10 部电影给出了高评分,但我也得到了低精度。 我阅读了一些使用交叉验证并将电影镜头拆分为训练和测试的论文,但算法没有数据的数值表示来训练我的模型。它通过 SPARQL 处理 Linked 开放数据并推荐相关电影。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。