如何解决使用List Comprehension在pandas DataFrame中创建新列
因此,我有一个pandas
DataFrame,其中包含几列,这些列包含一些值,我希望使用这些值使用已定义的函数来创建新列。我一直在计划使用this answer中详细介绍的Python的列表理解来做到这一点。这是我一直在尝试的:
df['NewCol1'],df['NewCol2'] = [myFunction(x=row[0],y=row[1]) for row in zip(df['OldCol1'],df['OldCol2'])]
这可以正常运行,直到需要将值分配给新列时,这时它会失败,我相信是因为它不是一直在迭代地分配值,而是尝试为每个列分配一个常量值。我觉得我已经接近正确地做到这一点,但是我还不太确定要完成的任务。
编辑:
数据都是字符串,并且该函数根据这些字符串从另一个源中获取一些不同的信息,如下所示:
def myFunction(x,y):
# read file based on value of x
# search file for values a and b based on value of y
return(a,b)
我知道这有点模糊,但是辅助函数的解释相当复杂。
收到的错误是:
ValueError: too many values to unpack (expected 4)
解决方法
您可以使用zip()
df['NewCol1'],df['NewCol2'] = zip(*[myFunction(x=row[0],y=row[1]) for row in zip(df['OldCol1'],df['OldCol2'])])
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。