如何解决如何通过将所有类型的填充都包含在一个函数中来处理缺失值?
我制作了一个简单的功能来处理缺失的值,但不幸的是,该功能无法正常工作。
这是我尝试过的示例:
#Basic libraries
import os
import pandas as pd
import numpy as np
def handle_missing(df,list_columns,handle_type,value):
if handle_type == "bfill":
df = df.loc[:,list_columns].fillna(method='bfill',inplace=True)
elif handle_type == "ffill":
df = df.loc[:,list_columns].fillna(method='bfill')
elif handle_type == "mean":
df = df[list_columns].fillna(df.mean()).round(2)
elif handle_type == "dropna0":
df = df[list_columns].dropna(axis=0,how='any')
elif handle_type == "dropna1":
df = df[list_columns].dropna(axis=1,how='any')
else:
df = df.loc[:,list_columns].fillna(value)
data_dict = {'First':[100,90,np.nan,95],'Second': [30,45,56,np.nan],'Third':[np.nan,40,80,98]}
df1 = pd.DataFrame(data_dict)
list_columns = ['First','Second','Third']
df1 = handle_missing(df1,"bfill",0)
df1
此功能是否有任何需要我集中注意的问题?
解决方法
您的函数看起来不错,除了它返回None
,因此您的df1
实际上是None
。我会这样重写函数:
def handle_missing(df,list_columns,handle_type,value):
if handle_type == "bfill":
# no inplace
df[list_columns] = df[list_columns].fillna(method='bfill')
elif handle_type == "ffill":
df[list_columns] = df.loc[:,list_columns].fillna(method='bfill')
elif handle_type == "mean":
df[list_columns] = df[list_columns].fillna(df.mean()).round(2)
elif handle_type == "dropna0":
df[list_columns] = df[list_columns].dropna(axis=0,how='any')
elif handle_type == "dropna1":
df[list_columns] = df[list_columns].dropna(axis=1,how='any')
else:
df[list_columns] = df.loc[:,list_columns].fillna(value)
现在,该功能将就地修改数据框。所以您只需要:
handle_missing(df1,['Third'],"bfill",999)
print(df1)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。