如何解决SHAP:随机森林多类的 TreeExplainer:从 shap 返回的类比数据中的实际类数更多
我有一个多类问题,其中标签可以采用 3 个值 [-1,1] 之一。我使用以下代码行对标签进行编码。 (** 如果我不应该使用 pd.get_dummies
对标签进行编码,请纠正我。)
Y = pd.get_dummies(Y,drop_first=False)
-1.0 0.0 1.0
0 0 0 1
1 1 0 0
2 0 0 1
3 1 0 0
4 1 0 0
... ... ...
6516 1 0 0
6517 0 0 1
6518 0 0 1
6519 0 0 1
6520 1 0 0
我试图用下面的方法计算形状值。
shap_values_abc = shap.TreeExplainer(my_randomForestClassifier).shap_values(X)
np.shape(shap_values_test)
(6,1369,188)
然而,我只有 3 个班级。为什么在这里返回 6 个类/维度?我的直觉告诉我,这 6 个类必须是 {not -1,-1,not 0,not 1,1}。但是,我真的不知道标签的顺序应该是什么。
-
顺序是 {not -1,1} 还是 {-1,不是 -1,不是 0,1,不是 1} ?
-
如何让它返回 3 个类?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。