如何解决如何在 XGBClassifier python 中使用分类数据
我正在用 python 开发 XGBClassifier。我的问题是,除了一个特征之外,所有其他特征都是分类特征。但是当将它们输入模型时,它会将它们视为连续特征。另外,我尝试将它们转换为使用 One hot encoding。但是没有用。这个问题怎么解决...
在这里我附上了我的树部分的图像。这里除了 f35,其他都是分类的
解决方法
您没有提到您的特征是如何存储的或者您需要编码哪个特征。因此,就本回答而言,假设您的功能名为 'cat'
,并且您的数据存储在名为 pandas.DataFrame
的 df
中。
为了编码一列,您可以尝试:
# Import encoder
from sklearn.preprocessing import OneHotEncoder
# Fit encoder to categorical feature
cat_enc = OneHotEncoder(sparse=False)
cat_enc.fit(df['cat'].values.reshape(-1,1))
# Add encoded feature to DataFrame
df[cat_enc.get_feature_names()] = cat_enc.transform(df['cat'].values.reshape(-1,1))
# Drop old column
df.drop(columns='cat',axis=1,inplace=True)
如果您想要更具体的答案,请更新您的帖子,我会更新我的答案。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。