微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么我的缺失值被我想要的东西所替代? Python

如何解决为什么我的缺失值被我想要的东西所替代? Python

我正在尝试替换数据框中丢失的数据。 根据我的需要正确替换了一些数据,但其余数据不起作用。

例如,我想为['Gender']列填充缺少的数据。 我尝试了2种不同的方法

  • 使用模式替换
for column in ['Gender']:
    df[column].fillna(df[column].mode().index[0],inplace = True)

它对超过95%的丢失数据有效,但是对于某些丢失的数据,它将其替换为'0'而不是模式(男性或女性)。

  • 所以我尝试了第二种方法,用Random代替
df['Gender'].fillna(lambda x: random.choice(df[df[Gender] != np.nan]['Gender']),inplace =True)

大约95%的相同问题已被正确替换,其余问题为我提供了以下替换数据:

代替男性或女性。

有人知道为什么以及如何解决此问题吗?

解决方法

由于传递索引而获得零,您应该写:

path

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。