如何解决从两个数据帧计算召回率,精度,对完整性和减少率
我正在尝试从两个数据集中计算召回率,准确性,配对完整性和减少率。
我有两个各有两列的数据框,如果两个数据集中有相同的对,我必须匹配。
true_record:
idA idB
128 96780
927 85940
958 12858
949 19784
726 19848
experiment_set:
idA idB
128 96780
927 11678
958 12858
949 84750
726 19848
上面的927和949没有匹配的IDB
我需要计算召回率是tp /(tp + fn)和精度是tp /(tp + fp)。我知道如何计算匹配记录的数量和不匹配的记录的数量,但是在这种情况下,我将如何计算召回率和精度?
另外,我需要在此附加数据帧中计算对完整性和减少率:
A_block:
block idA
A 128
B 958
A 234
C 948
D 726
B_block:
block idB
A 96780
B 12858
A 19784
C 84750
D 19848
在这里,我需要引用原始的true_record数据帧(它包含真实的数字,我要与之进行比较),并查看idA和idB对是否在同一块中。例如,块A包含128和96780,它们在true_record中是一对/行,因此它是真正的正数。
如有必要,我可以提供更多信息。谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。