在有管道和无管道的情况下,在RandomizedSearchCV内应用RFE

如何解决在有管道和无管道的情况下,在RandomizedSearchCV内应用RFE

我对在带有和不带有管道的gridsearchcv中应用RFE / RFECV有一些疑问。我经历了所有类似的问题,但它们并没有解决我的问题。非常感谢您的支持

在没有管道的情况下在GridSearch CV中使用RFE的常见方法如下:

grid = {"estimator__max_depth": [3,4],"max_depth": [3,4,5]}

scaler = StandardScaler()
X = scaler.fit_transform(X)

selector = RFE(XGBClassifier(verbosity=0),step=1,n_features_to_select =5)
clf = RandomizedSearchCV(selector,param_distributions=grid,cv=2)
clf.fit(X,y)

对于管道方法,我认为最合适的相关方法是:

class Mypipeline(Pipeline):
    @property
    def coef_(self):
        return self._final_estimator.coef_
    @property
    def feature_importances_(self):
        return self._final_estimator.feature_importances_ 

estimators = [('scaler',StandardScaler()),('clf',XGBClassifier())]


pipeline = Mypipeline(estimators)
selector = RFE(estimator=pipeline,n_features_to_select =3)

cv = RandomizedSearchCV(selector,cv=2)
cv.fit(X,y)

它只是将Scaler和XGBClassifier传递到管道,然后将其用作RFE步骤的估计器。但是与非流水线方法相比,它返回​​了不同的结果。可以通过Scaler工作方式的差异来解释(fit_transform在非管道方法中转换所有X和在管道方法中拆分X)。 但是,即使删除了Scaler步骤,结果仍然有所不同。 所以我的第一个问题是我是否以正确的方式应用管道方法是的,是否有任何理由会导致不同的结果。

还有其他使用管道进行RFE的方法,例如像this post中那样将所有3个步骤都放入管道中:

steps = [('scaler',('selector',RFE(XGBClassifier(verbosity=0),n_features_to_select =5)),('estimator',XGBClassifier())]

pipeline = Pipeline(steps)
cv = RandomizedSearchCV(pipeline,y)

我的第二个问题是:(2.1)在RFE步骤之后再次将XGBClassifier用作'clf'是否正确。和(2.2)对于删除第3步(“ clf”,XGBClassifier())的情况,我如何通过另一种方式在RandomizedSearchCV内部传递“ grid”字典:如何克服'ValueError:无效的参数估计器估计”?

steps = [('scaler',n_features_to_select =5))]

pipeline = Pipeline(steps)
cv = RandomizedSearchCV(pipeline,y)

ValueError: Invalid parameter estimator for estimator Pipeline(steps=[('scaler',RFE(estimator=XGBClassifier(...)

最后,我们可以将RFE和HPO分为两个单独的步骤,如this post中所示, 因此,我的最后一个问题是:在这方法中,对要采用哪种方法有何评论/建议?

TIA

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?