如何解决从训练数据集获取分类特征时出错
我的火车数据如下所示: train data
为了从中提取分类特征,我运行了以下代码"
categorial=[c for c in train.columns if train.columns(c).dtype in ['object'] ]
但我收到错误:
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-31-31eb7ac47e21> in <module>
----> 1 categorial=[c for c in train.columns if train.columns[c].dtype in ['object'] ]
<ipython-input-31-31eb7ac47e21> in <listcomp>(.0)
----> 1 categorial=[c for c in train.columns if train.columns[c].dtype in ['object'] ]
/opt/conda/lib/python3.7/site-packages/pandas/core/indexes/base.py in __getitem__(self,key)
4295 if is_scalar(key):
4296 key = com.cast_scalar_indexer(key,warn_float=True)
-> 4297 return getitem(key)
4298
4299 if isinstance(key,slice):
IndexError: only integers,slices (`:`),ellipsis (`...`),numpy.newaxis (`None`) and integer or boolean arrays are valid indices
可能的解决方案是什么?
解决方法
使用它来选择“对象”类型变量-
categorical = train.select_dtypes('object')
如果你只想要变量名 -
categorical_cols = train.select_dtypes('object').columns.tolist()
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。