如何解决皮尔逊相关系数,方法对吗?
我有两个数据集,我想找出它们的相关程度。
数据集代表两支球队的比赛结果,其中 1 代表赢,0 代表平局,-1 代表输。
例如5场比赛
team1 = [1,1,-1,0]
team2 = [0,0]
计算皮尔逊相关系数直到一支球队赢得最后 5 场比赛为止都很好,因此是一个常数数组,例如
team1 = [1,1]
在这种情况下,无论团队 2 做了什么,皮尔逊相关系数都将不确定。
我觉得这很奇怪,因为如果 team2 也赢了 5 场比赛中的大部分,那么相关性实际上应该接近 1,而不是不确定的。
反之亦然,如果team2输掉了大部分比赛,根据我的理解,相关性应该接近-1。
我在这里做错了吗?或者我的数据需要另一种方法来确定数据集之间的关系有多强?
提前致谢
解决方法
所以,我找到了这个很好的资源: http://www.ashukumar27.io/similarity_functions/
我想我会选择更适合我的用例的欧几里德距离
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。