如何解决如何对具有包含几个单词的字符串的分类列进行单热编码?
我正在使用 Python 解决分类问题。我想对当前具有字符串的列进行单热编码作为结果。下面是我正在寻找的一个例子。如果该列中的一行包含包含“bleu cheese”的字符串,我想将其编码为 0。对于所有其他结果,我想将其编码为 1。我不想要多列。我只想保留一列。
Dressing Salad
0 bleu Cheese Spinach
1 Thick bleu Cheese Chicken
2 Ranch Chicken
3 Italian Taco
我希望它看起来像这样
Dressing Salad
0 0 Spinach
1 0 Chicken
2 1 Chicken
3 1 Taco
任何想法将不胜感激。
解决方法
您可以像这样使用 Pandas
库:
data_dressing = pd.get_dummies(data['dressing'])
或者像这样使用 Series
:
data['dressing'] = pd.Series([1 if 'bleu cheese' in i else 0
for i in data['dressing']],index=data.index)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。