微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么这种情况下熊猫数据帧分配引发TypeError

环境:

Python 3.6.4
pandas 0.23.4

我的代码如下.

from math import sqrt
import pandas as pd
df = pd.DataFrame({'x':[1,2,3], 'y':[4,5,6]})

df = df.assign(d = lambda z: sqrt(z.x**2 + z.y**2))

最下面的一行引发TypeError,如下所示.

...
TypeError: cannot convert the series to <class 'float'>

没有sqrt,它可以工作.

df = df.assign(d2 = lambda z: z.x**2 + z.y**2)
df
Out[6]:
   x  y  d2
0  1  4  17
1  2  5  29
2  3  6  45

并申请也有效.

df['d3'] = df.apply(lambda z: sqrt(z.x**2 + z.y**2), axis=1)
df
Out[8]:
   x  y  d2        d3
0  1  4  17  4.123106
1  2  5  29  5.385165
2  3  6  45  6.708204

一个怎么了?

解决方法:

使用numpy.sqrt-它也适用于一维数组,而来自数学的sqrt仅适用于标量:

df = df.assign(d = lambda z: np.sqrt(z.x**2 + z.y**2))

一个解决方案是使用**(1/2):

df = df.assign(d = lambda z: (z.x**2 + z.y**2)**(1/2))
print (df)
   x  y         d
0  1  4  4.123106
1  2  5  5.385165
2  3  6  6.708204

您的解决方案可以正常工作,因为轴= 1在应用中按标量进行工作,但是像提到的@jpp一样,应用不应被首选,因为它涉及Python级的逐行循环.

df.apply(lambda z: print(z.x), axis=1)
1
2
3

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐