微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在熊猫列中创建单词的二进制表示?

如何解决如何在熊猫列中创建单词的二进制表示?

我有一列包含可变大小的列表。这些列表包含有限数量的短文本值。总共大约 60 个唯一值。

0    ["AC","BB"]
1    ["AD","CB","FF"]
2    ["AA","CC"]
3    ["CA","BB"]
4    ["AA"]

我想在我的数据框中创建这些值列,如果值在这一行中,则该列的值将为 1,否则为 0。

我知道我可以扩展列表,而不是调用 unique 并将它们设置为新列。但之后我不知道该怎么办?

解决方法

这是一种方法:

df = pd.get_dummies(df.explode('val')).sum(level = 0)

注意:这里的 (level=0) 有点像使用索引对内容进行分组的分组操作。所以,我更喜欢在分解数据框后使用它。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。