微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在隔离森林的sklearn实现中设置max_depth?

如何解决如何在隔离森林的sklearn实现中设置max_depth?

我使用了 sklearn 的 Isolation Forest,并用它来预测其他样本(来自同一群体)。由于样本量很大,我无法在整个数据上拟合 Forest(因为我无法将该数据转换为 Pandas 数据帧),因此采用了这种方法

因为这需要时间,所以我在考虑减少树木的最大深度。根据{{​​3}},“

每棵树的最大深度设置为 ceil(log_2(n)),其中是用于构建树的样本数(参见(Liu et al.,2008) 更多详情)

但由于我只想要最顶端的异常,我想我可以将树的深度限制为甚至小于 ceil(log_2(n))。而且我认为这可能会减少使用该模型进行拟合和进行预测所需的时间。但是 sklearn 不支持参数 max_depth。有没有办法在 max_depth

中指定 sklearn

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。