如何解决为什么 Pandas Series `in` 的操作方式与其他所有数据结构都不同?
大多数数据结构利用 Python 的 in
运算符来要么返回keys
或 values
。 Pandas 系列混合这些。我的问题是为什么它们混合在一起?这有什么功能目的吗?
明确地说,我不是在问机制是如何工作的;已被多次询问,例如 here 和 here。我在问为什么它以这种(可以说是违反直觉的)方式实施。
我说这是违反直觉的,因为它会导致这样的行为:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.ones((3,3)),columns=['a','b','c'])
df.replace(1,'abc',inplace=True)
a = df['a']
print([x in a for x in a])
# This will print
# [False,False,False]
我能想到的所有其他数据结构(包括 Pandas DataFrames)都将返回 True
而不是 False
的列表,因为成员资格 (x in a
) 和迭代 (for x in a
) 对同一个项目进行操作,either keys
(如字典)或 values
(如列表)。
TLDR: Series 对象遍历 values
并检查 keys
中的成员资格。这种实现背后的原因是什么?
附言对于任何登陆这里想知道如何迭代键的人,只需在 Series 对象上使用 `.values()' 方法。最efficient。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。