给定一个多索引DataFrame,我想组合重复的索引对并将其值列出为逗号分隔的列表.例如,输入:
df = pd.DataFrame({'Last Name' : ['Deere','Deere','Foo' ,'Foo' ,'Man' ],
'First Name': ['John' ,'Jane' ,'Kung' ,'Kung' ,'Karate'],
'Value1': [ 1 , 2 , 3 , 4 , 5 ],
'Value2': ['Green','Blue' ,'Yellow','Black','Purple']})
df.set_index(['Last Name','First Name'],inplace=True)
提供:
Value1 Value2
Last Name First Name
Deere John 1 Green
Jane 2 Blue
Foo Kung 3 Yellow
Kung 4 Black
Man Karate 5 Purple
我想将其转换为以下DataFrame:
Value1 Value2
Last Name First Name
Deere John 1 Green
Jane 2 Blue
Foo Kung 3,4 Yellow,Black
Man Karate 5 Purple
解决方法:
您可以先将astype
列的Value1转换为字符串,然后按agg
的姓氏和名字级别将groupby
转换为字符串:
df['Value1'] = df['Value1'].astype(str)
result = df.groupby(level=['Last Name','First Name'], sort=False).agg( ','.join)
print result
Value1 Value2
Last Name First Name
Deere John 1 Green
Jane 2 Blue
Foo Kung 3,4 Yellow,Black
Man Karate 5 Purple
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。