微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python-如何透视pandas DataFrame列以创建二进制“值表”?

我有以下熊猫数据框:

import pandas as pd
df = pd.read_csv("filename.csv")

df 
     A   B         C         D        E    
0    a  0.469112 -0.282863 -1.509059  cat  
1    c -1.135632  1.212112 -0.173215  dog   
2    e  0.119209 -1.044236 -0.861849  dog   
3    f -2.104569 -0.494929  1.071804  bird   
4    g -2.224569 -0.724929  2.234213  elephant
...

我想基于列E中的分类值的标识创建更多列,以使数据框如下所示:

 df 
         A   B         C         D        cat    dog     bird    elephant ....    
    0    a  0.469112 -0.282863 -1.509059  -1      0       0       0
    1    c -1.135632  1.212112 -0.173215   0     -1       0       0
    2    e  0.119209 -1.044236 -0.861849   0     -1       0       0
    3    f -2.104569 -0.494929  1.071804   0      0      -1       0
    4    g -2.224569 -0.724929  2.234213   0      0       0       0
    ...

也就是说,我根据E的值将E列的值设置为二进制矩阵,如果存在该值,则给出1;对于不存在的所有其他值,给出0(在这里,我希望它为-1或“负二进制矩阵”)?

我不确定pandas中哪个函数最能做到这一点:也许pandas.DataFrame.unstack()?

任何见解表示赞赏!

解决方法:

使用pd.concat,drop和get_dummies

pd.concat([df.drop('E', 1), pd.get_dummies(df.E).mul(-1)], axis=1)

enter image description here

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐