如何解决列中相应值的 NaN 值的百分比
Python 菜鸟来了
有两列; “项目编号”(项目 1、项目 2、项目 3 等)和“预期日期”(DD/MM/YYYY)以及许多“预期日期”值都是 NaN,我想计算每个项目编号的 NaN,即项目 1 的 NaN 为 29%,项目 2 为 55%,项目 3 为 40%,依此类推
我知道您可以使用以下代码获取单个列的百分比,但我正在努力弄清楚如何执行上述操作?
df['Date Expected'].value_counts(normalize=True)*100
预先感谢您的任何帮助
解决方法
试试:
nan_pers = df.groupby("Project Number")["Date Expected"]\
.value_counts(normalize=True,dropna=False)\
.reset_index(level="Date Expected",name="NaN percentage") * 100
nan_pers = nan_pers[nan_pers["Date Expected"].isna()].drop(columns="Date Expected")
将 dropna=False
传递给 value_counts
表示它也应该报告 NaN
的计数。然后我们有一个多索引数据框,因此我们在 reset_index
级别上 "Date Expected"
并将其值(归一化计数)重命名为 NaN percentage
并且它自己成为一列。在第二行中,我们将非 NaN
值连同具有唯一 Date Expected
值的列一起删除,因此我们留下了类似
NaN percentage
Project Number
Project 1 50.0
Project 2 20.0
Project 3 40.0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。