为什么 Pandas Series `in` 的操作方式与其他所有数据结构都不同？

如何解决为什么 Pandas Series `in` 的操作方式与其他所有数据结构都不同？

大多数数据结构利用 Python 的 in 运算符来要么返回keys 或 values。 Pandas 系列混合这些。我的问题是为什么它们混合在一起？这有什么功能目的吗？

明确地说，我不是在问机制是如何工作的；已被多次询问，例如 here 和 here。我在问为什么它以这种（可以说是违反直觉的）方式实施。

我说这是违反直觉的，因为它会导致这样的行为：

import pandas as pd
import numpy as np

df = pd.DataFrame(np.ones((3,3)),columns=['a','b','c'])
df.replace(1,'abc',inplace=True)

a = df['a']
print([x in a for x in a])

# This will print
# [False,False,False]

我能想到的所有其他数据结构（包括 Pandas DataFrames）都将返回 True 而不是 False 的列表，因为成员资格 (x in a) 和迭代 (for x in a ) 对同一个项目进行操作，either keys（如字典）或 values（如列表）。

TLDR： Series 对象遍历 values 并检查 keys 中的成员资格。这种实现背后的原因是什么？

附言对于任何登陆这里想知道如何迭代键的人，只需在 Series 对象上使用 `.values()' 方法。最efficient。

为什么 Pandas Series `in` 的操作方式与其他所有数据结构都不同？

如何解决为什么 Pandas Series `in` 的操作方式与其他所有数据结构都不同？

相关推荐