原文件:
df_org = pd.DataFrame([[807, '其他', 15],
[807, '尿常规', 1],
[2421, '尿常规', 0],
[2421, 'PTH', 300],
[878, 'PTH', 312],
[878, '血常规', 0.018]],
columns=['患者ID', '项目名称', '结果'])
输出:
完整代码:
import pandas as pd
df_org = pd.DataFrame([[807, '其他', 15],
[807, '尿常规', 1],
[2421, '尿常规', 0],
[2421, 'PTH', 300],
[878, 'PTH', 312],
[878, '血常规', 0.018]],
columns=['患者ID', '项目名称', '结果'])
print('原文件:\n', df_org)
df_new = pd.DataFrame(None, columns=('患者ID', *df_org['项目名称'].drop_duplicates()))
df_new['患者ID'] = df_org['患者ID'].drop_duplicates()
def fn(x):
df_fn = df_org[df_org['患者ID'] == x['患者ID']] # 取出同一ID的数据
for i in x.index:
if i != '患者ID':
value = df_fn[df_fn['项目名称'] == i]['结果'].values # 获得对应列的值
if len(value) > 0:
x[i] = value[0] # 将值放入新的表格
return x
df_new = df_new.apply(lambda x: fn(x), axis=1) # 取出每一行数据, 通过方法fn(x)进行匹配
print('新文件:\n', df_new)
输出:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。