我想用逗号加入Pandas数据框的2列,即:第1列中的“abc”与第2列中的“123”连接成为“abc,123”.
例如:
>>> import pandas as pd
>>> import numpy as np
>>> df = pd.DataFrame({'IDx': ['a','b',np.nan,'C'], 'IDy':['1','','2','D']})
>>> df
IDx IDy
0 a 1
1 b
2 NaN 2
3 C D
以下不起作用:
>>> ', '.join([df['IDx'],df['IDy']])
>>> df.apply(lambda x: ', '.join([x['IDx'],x['IDy']]))
这是期望的结果:
>>> df = pd.DataFrame({'ID': ['a, 1', 'b', '2', 'C, D']})
>>> df
ID
0 a, 1
1 b
2 2
3 C, D
解决方法:
您可以使用apply
和fillna
来清空字符串,将map
列用于字符串和strip
:
df['ID'] = df[['IDx', 'IDy']].apply(lambda x: ','.join(x.fillna('').map(str)), axis=1)
df['ID'] = df['ID'].str.strip(',')
print df
IDx IDy ID
0 a 1 a,1
1 b b
2 NaN 2 2
3 C D C,D
或fillna
清空字符串,astype
清空字符串和strip
:
df['ID'] = df['IDx'].fillna('').astype(str) + ',' + df['IDy'].fillna('').astype(str)
df['ID'] = df['ID'].str.strip(',')
print df
IDx IDy ID
0 a 1 a,1
1 b b
2 NaN 2 2
3 C D C,D
编辑:如果你的列的dtype是字符串,你可以省略map或astype:
df['ID'] = df[['IDx', 'IDy']].apply(lambda x: ','.join(x.fillna('')), axis=1)
df['ID'] = df['ID'].str.strip(',')
要么:
df['ID'] = df['IDx'].fillna('') + ',' + df['IDy'].fillna('')
df['ID'] = df['ID'].str.strip(',')
print df
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。