微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何绘制熊猫数据框中列中位数的堆积条形图?

如何解决如何绘制熊猫数据框中列中位数的堆积条形图?

所以我是一个学习 Pandas (python) 数据可视化的新手,我的任务是为 30 到 35 岁的年龄组创建一个周数和 CodeRevHrs 中位数的堆叠图。

以下是我在年龄列上应用过滤器提取数据的代码,下面是数据集的前五行

age_filter= agework [(agework["age"]>= 30 )&(agework["age"]<=35)] 
median_weekhrs= age_filter["Weekhrs"].median()
median_coderev= age_filter["CodeRevHrs"].median()

age_filter.head()

    CodeRevHrs  Weekhrs age
5   3.0          8.0    31.0
11  2.0         40.0    34.0
12  2.0         40.0    32.0
18  15.0        42.0    34.0
22  2.0         40.0    33.0

如何绘制带有中位数的堆积条形图?

请帮忙

解决方法

首先,过滤年龄(并将年龄转换为 int,因为它可以使标签更清晰):

df = agework.query('30 <= age <= 35')
df['age'] = df['age'].astype(int)

然后,您可以绘制每个年龄组中两个数量的中位数的条形图:

df.groupby('age').median().plot.bar(stacked=True)
plt.title('Median hours,by age')

顺便说一句,您可以对值的堆叠方式施加任意顺序。例如,如果您希望在底部使用 'Weekhrs',您可以说:

order = ['Weekhrs','CodeRevHrs']
df.groupby('age')[order].median().plot.bar(stacked=True)
plt.title('Median hours,by age')

现在,如果您想绘制整个过滤年龄范围内这些数量的总体中位数(如您所说:每个数量的一个数字),那么一种方式(众多)将是:

label = f"{df['age'].min()}-{df['age'].max()}"
df.median().drop('age').to_frame(label).T.plot.bar(stacked=True)
plt.title(f'Median hours for age {label}')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。