微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

残差散点图的线性回归循环

如何解决残差散点图的线性回归循环

我正在运行线性回归模拟,每个模型都根据“标签”变量的不同值。我可以为每个模型打印指标,但我无法为每个模型运行不同的散点图。所有图形都在单个散点图中重现。我想为每个模型运行一个指标和一个不同的散点图

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import binom
from scipy.stats import norm
import numpy as np

from scipy.stats import norm
# generate random numbers from N(0,1)
x = norm.rvs(size=10000,loc=0,scale=1)
y = norm.rvs(size=10000,scale=1)
z = binom.rvs(n=10,p=0.8,size=10000)
df = pd.DataFrame(data={'v1':x.flatten(),'target':y.flatten(),'label':z.flatten()})

classes=df.label.unique().tolist()
results = []


for name in classes:
    df_subset=df.loc[df['label']==name]
    
    reg = LinearRegression()
    reg.fit(df_subset['v1'].values.reshape(-1,1),df_subset["target"].values.reshape(-1,1))
    predictions = reg.predict(df_subset['v1'].values.reshape(-1,1))
    
    res=np.mean((predictions - df_subset["target"].values.reshape(-1,1)) ** 2)
    results.append(res)
    
    msg = "Metric model %s: %f " % (name,res)
    print(msg)
    
    df_subset['pred']=predictions
    sns.scatterplot(data=df_subset,x='pred',y="target")

解决方法

只需在 sns 绘图之前创建一个新图形即可。 plt.figure() plt.show() 以便您可以在每个绘图之前显示打印语句(模型度量)。

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.stats import binom
from scipy.stats import norm
import numpy as np
import seaborn as sns

from scipy.stats import norm
# generate random numbers from N(0,1)
x = norm.rvs(size=10000,loc=0,scale=1)
y = norm.rvs(size=10000,scale=1)
z = binom.rvs(n=10,p=0.8,size=10000)
df = pd.DataFrame(data={'v1':x.flatten(),'target':y.flatten(),'label':z.flatten()})

classes=df.label.unique().tolist()
results = []


for name in classes:
    df_subset=df.loc[df['label']==name]
    
    reg = LinearRegression()
    reg.fit(df_subset['v1'].values.reshape(-1,1),df_subset["target"].values.reshape(-1,1))
    predictions = reg.predict(df_subset['v1'].values.reshape(-1,1))
    
    res=np.mean((predictions - df_subset["target"].values.reshape(-1,1)) ** 2)
    results.append(res)
    
    msg = "Metric model %s: %f " % (name,res)
    print(msg)
    plt.figure() #<-----------here
    df_subset['pred']=predictions
    sns.scatterplot(data=df_subset,x='pred',y="target")
    plt.show() #<------------ here
,

我建议先安装 matplotlib 库,然后

import matplotlib.pyplot as plt
y = 0
.
.
.
#inside your for loop
plot = sns.scatterplot(data=df_subset,y="target")
plt.savefig('plot_' + str(y))
plt.clf()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。