微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 复制Pandas DF N次

所以现在,如果我多个列表,即x = [1,2,3] * 2我得到x为[1,2,3,1,2,3]但这对Pandas不起作用.

因此,如果我想要复制PANDAS DF,我必须将列作为列表和多个:

col_x_duplicates =  list(df['col_x'])*N

new_df = DataFrame(col_x_duplicates, columns=['col_x'])

然后对原始数据进行连接:

pd.merge(new_df, df, on='col_x', how='left')

这现在重复大熊猫DF N次,有更简单的方法吗?甚至更快的方式?

解决方法:

实际上,由于你想复制整个数据框(而不是每个元素),numpy.tile()可能更好:

In [69]: import pandas as pd

In [70]: arr = pd.np.array([[1, 2, 3], [4, 5, 6]])

In [71]: arr
Out[71]: 
array([[1, 2, 3],
       [4, 5, 6]])

In [72]: df = pd.DataFrame(pd.np.tile(arr, (5, 1)))

In [73]: df
Out[73]: 
   0  1  2
0  1  2  3
1  4  5  6
2  1  2  3
3  4  5  6
4  1  2  3
5  4  5  6
6  1  2  3
7  4  5  6
8  1  2  3
9  4  5  6

[10 rows x 3 columns]

In [75]: df = pd.DataFrame(pd.np.tile(arr, (1, 3)))

In [76]: df
Out[76]: 
   0  1  2  3  4  5  6  7  8
0  1  2  3  1  2  3  1  2  3
1  4  5  6  4  5  6  4  5  6

[2 rows x 9 columns]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐