微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

利用pandas将某一列数据按照ID由列变成行,并在对应的列填值

文件

df_org = pd.DataFrame([[807, '其他', 15],
                       [807, '尿常规', 1],
                       [2421, '尿常规', 0],
                       [2421, 'PTH', 300],
                       [878, 'PTH', 312],
                       [878, '血常规', 0.018]],
                      columns=['患者ID', '项目名称', '结果'])

输出

在这里插入图片描述

需求:将“项目名称”下的数据 ,横向变成列,然后根据“患者ID”,在对应的列填对应的值,没有值的不用填。最终每一行的数据,包含一个“患者ID”的数据。

完整代码

import pandas as pd

df_org = pd.DataFrame([[807, '其他', 15],
                       [807, '尿常规', 1],
                       [2421, '尿常规', 0],
                       [2421, 'PTH', 300],
                       [878, 'PTH', 312],
                       [878, '血常规', 0.018]],
                      columns=['患者ID', '项目名称', '结果'])

print('原文件:\n', df_org)

df_new = pd.DataFrame(None, columns=('患者ID', *df_org['项目名称'].drop_duplicates()))
df_new['患者ID'] = df_org['患者ID'].drop_duplicates()


def fn(x):
    df_fn = df_org[df_org['患者ID'] == x['患者ID']]  # 取出同一ID的数据
    for i in x.index:
        if i != '患者ID':
            value = df_fn[df_fn['项目名称'] == i]['结果'].values  # 获得对应列的值
            if len(value) > 0:
                x[i] = value[0]  # 将值放入新的表格
    return x


df_new = df_new.apply(lambda x: fn(x), axis=1)  # 取出每一行数据, 通过方法fn(x)进行匹配

print('新文件:\n', df_new)

输出

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐