如何解决如何优化df.assign?
我正在使用形状为(55025,12)的数据框(data
)上的python,并且尝试分配一个新列,我的代码是:
data_cat=data.assign(
type0 = lambda dataframe: dataframe['value'].map(lambda x: x>0),type1= lambda dataframe: dataframe['value'].map(lambda x: x>1,type2 = lambda dataframe: dataframe['value'].map(lambda x: x>2)
)
,它永远需要运行。我该如何优化呢?
谢谢!
解决方法
您可以直接在原始数据帧上创建新列,以免复制数据(如果这样做不会造成损害)。
data["type0"] = data["value"].gt(0)
data["type1"] = data["value"].gt(1)
...
否则assign
很好
data_cat = data.assign(
type0=data["value"].gt(0),type1=data["value"].gt(1),...
)
另请参阅pandas accessors,以了解可能已在熊猫中实施的其他一些常见操作。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。