shap.Explainer 构造函数错误要求未记录的位置参数

如何解决shap.Explainer 构造函数错误要求未记录的位置参数

我正在使用 python shap 包来更好地理解我的机器学习模型。 (来自documentation:“SHAP(SHpley Additive exPlanations)是一种解释任何机器学习模型输出的博弈论方法。”下面是我得到的错误的一个可重现的小例子:

Python 3.8.1 (tags/v3.8.1:1b293b6,Dec 18 2019,23:11:46) [MSC v.1916 64 bit (AMD64)] on win32
Type "help","copyright","credits" or "license" for more information.
>>> import shap
>>> shap.__version__
'0.37.0'
>>> from sklearn.model_selection import train_test_split
>>> from sklearn.linear_model import LogisticRegression
>>> 
>>> iris = shap.datasets.iris()
>>> X_train,X_test,y_train,y_test = train_test_split(*iris,random_state=1)
>>> model = LogisticRegression(penalty='none',max_iter = 1000,random_state=1)
>>> model.fit(X_train,y_train)
>>> 
>>> explainer = shap.Explainer(model,data=X_train,masker=shap.maskers.Impute(),...                            feature_names=X_train.columns,algorithm="linear")
Traceback (most recent call last):
  File "<stdin>",line 1,in <module>
TypeError: __init__() missing 1 required positional argument: 'data'

根据堆栈跟踪,错误似乎发生在顶级函数调用中,而不是在对 Impute() 的调用中。我也试过省略 data= 部分,这会引发同样的错误。这对我来说似乎很奇怪,因为 Explainer 对象的 documentationsource code 都没有提到任何 data 参数(我确认它来自我正在使用的同一个包版本):

__init__(model,masker=None,link=CPUDispatcher(<function identity>),algorithm='auto',output_names=None,feature_names=None,**kwargs)

有什么想法吗?这是一个错误,还是我遗漏了一些明显的东西?

解决方法

Impute 的初始化 signature 是:

def __init__(self,data,method="linear")

因此您的错误。所以,而不是:

explainer = shap.Explainer(model,data=X_train,masker=shap.maskers.Impute(),feature_names=X_train.columns,algorithm="linear")

您应该将X_train提供给掩码:

explainer = shap.Explainer(model,masker=shap.maskers.Impute(data=X_train),algorithm="linear")

因为 masker 负责处理新 API 中的数据。

不幸的是,即使这样也行不通,因为 Impute 掩码 implies feature_perturbation = "correlation_dependent" 而它没有 seem ready

不过,Independent 掩码器运行良好:

import shap
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

iris = shap.datasets.iris()
X_train,X_test,y_train,y_test = train_test_split(*iris,random_state=1)
model = LogisticRegression(penalty="none",max_iter=1000,random_state=1)
model.fit(X_train,y_train)

masker = shap.maskers.Independent(data=X_test)

explainer = shap.Explainer(
    model,masker=masker,algorithm="linear"
)

sv = explainer(X_test)
sv.base_values[0]

array([-5.0060995,13.03460398,-8.02850448])

如果您的数据集中有缺失的数据,您可以根据您的首选插补策略自行插补数据,并将其提供给 Independent

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)&gt; insert overwrite table dwd_trade_cart_add_inc &gt; select data.id, &gt; data.user_id, &gt; data.course_id, &gt; date_format(
错误1 hive (edu)&gt; insert into huanhuan values(1,&#39;haoge&#39;); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive&gt; show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 &lt;configuration&gt; &lt;property&gt; &lt;name&gt;yarn.nodemanager.res