如何解决如何合并来自 2 个不同熊猫数据帧的变量以进行绘图?
Date_reported Country New_cases Cumulative_cases
0 23-Feb-20 Singapore 10 10
0 26-Mar-20 Singapore 100 110
0 27-Apr-20 Singapore 200 310
0 28-May-20 Singapore 400 710
0 30-Jun-20 Singapore 1000 1710
我设法以这种形式生成了每月案例的分组数据:
Date_reported
February 10
march 100
April 200
May 400
June 1000
使用此代码:
df = pd.read_csv('Stackoverflow1.csv')
df['Date_reported'] = pd.to_datetime(df['Date_reported'])
df.groupby(df['Date_reported'].dt.strftime('%B'))['New_cases'].sum().sort_values()
我还有一个像这样的第二个熊猫数据框:
Variables 2020 Feb 2020 Mar 2020 Apr 2020 May 2020 June
Hotel Revenue $100 $90 $80 $70 $60
Occupancy Rate 80% 70% 60% 50% 40%
我的最终结果是基于各个月份合并第一个数据框中每月报告的病例数据和第二个数据框中的变量(即针对酒店收入的每月 Covid 病例)并绘制一个简单的图表。
即
Date_reported Monthly_cases Hotel Revenue Occupancy Rate
February 10 $100 80%
march 100 $90 70%
April 200 $80 60%
May 400 $70 50%
June 1000 $60 40%
但是,我遇到了两个问题:
-
尽管我设法制作了月度摘要,但我无法将月度案例本身的分组数据转换为列表,以针对第二个数据框中的变量进行绘图。
-
尽管我设法使用此代码转置了第二个数据帧,
hotel = pd.read_csv('Stackoverflow2.csv') hotel2 = hotel.T headers = hotel2.iloc[0] hotel2 = pd.DataFrame(hotel2.values[1:],columns=headers)
我没有将日期作为索引显示如下:
Variables Hotel Revenue Occupancy Rate
2020 Feb $100 80%
2020 Mar $90 70%
2020 Apr $80 60%
2020 May $70 50%
2020 Jun $60 40%
您的帮助将不胜感激,因为我是一个与 Pandas 和 Python 苦苦挣扎的初学者。如果您有更好的呈现方式,请告诉我。谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。