微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python pandas交叉表的问题

如何解决python pandas交叉表的问题

我正在尝试使用以下代码行在名为“d_recent”的数据框上运行交叉表:

pd.crosstab(d_recent['BinnedAge'],' d_recent['APBI']')  

我得到的输出是这样的:

|Age Bin|Brachytherapy|EBRT|IORT|
|-------|-------------|----|----|
|51-60|1|1|0|
|71-80|86|62|11|
|61-70|2578|723|276|
|41-50|9386|2049|1188|
|81-90|13860|3257|2449|
|31-40|7725|2078|1628|
|21-30|1958|615|425|

这是错误的。它应该是什么样子:

|Age Bin|Brachytherapy|EBRT|IORT|
|-------|-------------|----|----|
|21-30|1|1|0|
|31-40|86|62|11|
|41-50|2578|723|276|
|51-60|9386|2049|1188|
|61-70|13860|3257|2449|
|71-80|7725|2078|1628|
|81-90|1958|615|425|

知道这里发生了什么以及我该如何解决吗?我可以看出第一个表中行的顺序与我的数据框中遇到的特定 bin 的顺序有关。如果在运行交叉表之前按年龄排序,我可以获得正确的输出,但这不是一个可取的解决方案,因为我需要使用多个变量来执行此操作。谢谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。