微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

创建数据框,说明数字在多列中出现的概率,python

如何解决创建数据框,说明数字在多列中出现的概率,python

我有 4 列,想创建一个新的数据框,说明数字 1-10 出现的概率(计算每个数字出现的次数并将其除以列中值的总数)。到目前为止,我只设法分别找到了每列中出现的频率。有人可以帮我吗?

freq_job1 = data_rel1.groupby('job1_category').size()
{'job1_category': {0: 5.0,1: 5.0,2: 4.0,3: 5.0,4: 10.0,5: 4.0,6: 5.0,7: 5.0,8: 2.0,9: 4.0,10: 4.0,11: nan,12: 5.0,13: 4.0,14: 4.0,15: 8.0,16: 4.0,17: 4.0,18: 3.0,19: 4.0,20: 4.0,21: 3.0,22: 4.0,23: 4.0,24: 4.0,25: 1.0,26: 4.0,27: 6.0,28: 6.0,29: 3.0,30: 4.0,31: 3.0,32: 4.0,33: 4.0,34: 4.0,35: 4.0,36: 4.0,37: 4.0,38: 4.0,39: 4.0,40: 4.0,41: 5.0,42: 5.0,43: 4.0,44: 4.0,45: 1.0,46: 7.0,47: 7.0,48: 7.0,49: 7.0,50: 5.0,51: 8.0,52: 7.0,53: 4.0,54: 7.0,55: 9.0,56: 8.0,57: nan,58: 3.0,59: 3.0,60: nan,61: 4.0,62: 7.0,63: 4.0,64: 7.0,65: 8.0,66: 7.0,67: 7.0,68: 7.0,69: 8.0,70: 8.0,71: 5.0,72: 8.0,73: 10.0,74: 3.0,75: 10.0,76: nan,77: 4.0,78: 8.0,79: 7.0,80: nan,81: 4.0,82: 7.0,83: nan,84: 4.0,85: 8.0,86: 10.0,87: 4.0,88: 8.0,89: 4.0,90: 5.0,91: 7.0,92: 4.0,93: 7.0,94: 4.0,95: 4.0,96: nan,97: 10.0,98: 1.0,99: 5.0},'job2_category': {0: nan,1: nan,2: nan,3: nan,4: nan,5: nan,6: nan,7: nan,8: nan,9: nan,12: nan,13: nan,16: nan,19: nan,20: nan,21: nan,22: nan,23: nan,24: nan,25: nan,26: nan,27: nan,28: nan,29: nan,30: nan,31: nan,33: nan,34: nan,35: nan,37: nan,38: nan,39: nan,41: nan,42: nan,43: nan,44: nan,45: nan,46: nan,48: nan,49: nan,52: nan,54: nan,55: nan,58: nan,59: nan,61: nan,62: nan,63: nan,64: nan,67: nan,68: nan,69: nan,72: nan,73: nan,74: nan,78: nan,79: nan,81: nan,82: nan,84: nan,85: nan,87: nan,89: nan,90: nan,91: nan,92: nan,93: nan,95: nan,97: nan,98: nan,'job3_category': {0: 5.0,14: nan,15: 1.0,18: 4.0,32: 7.0,47: 10.0,50: 4.0,51: nan,56: 9.0,65: 7.0,70: 7.0,71: 7.0,75: 7.0,76: 8.0,77: 5.0,86: 4.0,88: 4.0,99: 9.0},'job4_category': {0: nan,11: 4.0,15: nan,47: 9.0,51: 4.0,56: nan,66: 8.0,71: 4.0,77: 10.0,83: 7.0,86: 5.0,94: 1.0,99: 1.0}}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。