如何解决熊猫重新调整数据框列与其他列规范化一致
我有数据框:
df1
col1 col2 col_base
0 1142 177 596821046
1 24 22 552973776
2 105 6 593632325
3 50 18 47238004
我想将 col_base 规范化为 范围并自动重新缩放剩余的列。
我遇到的问题是我知道我可以安装一些 MinMaxScaler 或一些 sklearn.preprocessing 规范化器,但我不想手动划分 col1、col2,但我正在寻找一些自动化的方式,所以输出是:
col1_rs col2_rs col_base_norm
0 1142.000000 177.000000 1.000000
1 26.080799 23.907399 0.920217
2 105.612773 6.035016 0.994198
3 NaN NaN 0.000000
这是我当前的代码:
a,b = 0,1
x,y = df1.col_base.min(),df1.col_base.max()
df1['col_base_norm'] = (df1.col_base - x) / (y - x) * (b - a) + a
df1['col1_rs'] = df1['col1'] / df1['col_base_norm']
df1['col2_rs'] = df1['col2'] / df1['col_base_norm']
df1 = df1.replace([np.inf,-np.inf],np.nan,inplace=False)
df1[['col1_rs','col2_rs','col_base_norm']]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。