微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

pd.get_dummies() 来自带有整数0 和 1的列

如何解决pd.get_dummies() 来自带有整数0 和 1的列

我有一个包含三列的数据框,一个是浮点/连续变量(高度),两个是整数/分类变量(糖尿病、性别)。

我想为分类变量生成虚拟变量,以便我可以构建回归模型。

问题是我在尝试使用 KeyError: ('diabetes','sex') 时收到错误消息 (pd.get_dummies())。

我不知道为什么会收到错误消息。我认为使用 .astype(str)解决这个问题,因为我过去从字符串变量生成哑元没有遇到过问题。

感谢您的帮助!

# library 
import pandas as pd

# data 
df = pd.DataFrame({'height': [1.77,1.54,1.52],'diabetes': [0,1],'sex': [1,1]})

# Failed attempt at generating dummies 
dummies = pd.get_dummies(df['diabetes','sex'].astype(str),prefix=['diabetes','sex'])


# expected outcome/goal  
expected = pd.DataFrame({'diabetes_0': [1,1,0],'diabetes_1': [0,'sex_0': [0,'sex_1': [1,1]})

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。