在将数据框转换为数据透视表时,我发现了熊猫的怪异行为.
import pandas as pd
df = pd.DataFrame({'car_id': {0: 'Trabant', 1: 'Buick', 2: 'Dodge'}, 'car_order': {0: 2, 1: 1, 2: 14}, 'car_name': {0: 'Trabant', 1: 'Buick', 2: 'Dodge'}, 'car_rank': {0: 111111317.29, 1: 1111112324.0, 2: 1111112324.5}})
table = df.pivot_table(index=['car_id', 'car_name', 'car_order'], columns=[],values=['car_rank'], fill_value='',dropna=True)
print table
df1 = pd.DataFrame({'car_id': {0: 'Trabant', 1: 'Buick', 2: 'Dodge'}, 'car_order': {0: 2, 1: 1, 2: 14}, 'car_name': {0: 'Trabant', 1: 'Buick', 2: 'Dodge'}, 'car_rank': {0: 17.29, 1: 24.0, 2: 24.5}})
table1 = df1.pivot_table(index=['car_id', 'car_name', 'car_order'], columns=[],values=['car_rank'], fill_value='',dropna=True)
print table1
结果输出:
Table
car_rank
car_id car_name car_order
Buick Buick 1 1111112324
Dodge Dodge 14 1111112324
Trabant Trabant 2 111111317
Table 1
car_rank
car_id car_name car_order
Buick Buick 1 24.00
Dodge Dodge 14 24.50
Trabant Trabant 2 17.29
您知道为什么在表中将值转换为int并为表1的值保留为浮点数吗?
熊猫0.18.0,python 2.7.9
解决方法:
这是我对熊猫0.18.0的观察结果:
pandas / tools / pivot.py的数据源的pivot_table()行定义:141-142:
if fill_value is not None:
table = table.fillna(value=fill_value, downcast='infer')
这正是枢转DF发生的情况:
In [78]: df.fillna('', downcast='infer')
Out[78]:
car_id car_name car_order car_rank
0 Trabant Trabant 2 111111317
1 Buick Buick 1 1111112324
2 Dodge Dodge 14 1111112324
类型:
In [48]: df.fillna('', downcast='infer').dtypes
Out[48]:
car_id object
car_name object
car_order int64
car_rank int64
dtype: object
有趣的是-如果您正确地使用了ivot_table()(即用于透视)-它可以正常工作:
In [81]: df.pivot_table(index=['car_id', 'car_order'], columns=['car_name'], values=['car_rank'],dropna=True, fill_value='')
Out[81]:
car_rank
car_name Buick Dodge Trabant
car_id car_order
Buick 1 1111112324.00
Dodge 14 1111112324.50
Trabant 2 111111317.29
PS我仍然不明白为什么您会以这种奇怪的方式使用pivot_table-您将要实现什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。