微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

不同长度的两个变量之间的回归线性

如何解决不同长度的两个变量之间的回归线性

我需要计算因变量和自变量之间的相关系数,这些变量在两个不同的文件但格式相同,问题是这两个变量的长度不一样,我不知道如何我能解决这个问题吗。 请帮帮我,

#scatter plot:
data1=pd.read_csv('b1.txt',delimiter=';')
print(data1.shape)
#print(data1.head())
data2=pd.read_csv('tab01.txt',delimiter=';')
print(data2.shape)
X=data1['Hm0'].values
Y=data2['Hs'].values

#mean X and Y:
x_mean=np.mean(X)
y_mean=np.mean(Y)
# Total number of values
n= len(X)
# #calculate b1 et b2:
numer=0
denom=0
for i in range(n):
    numer += (X[i]-x_mean)*(Y[i]-y_mean)
    denom +=(X[i] -x_mean)**2
b1=numer/denom
b0=y_mean-(b1*x_mean)
print(b1,b0)
(717,25)
(697,10)
Traceback (most recent call last):

numer += (X[i]-x_mean)*(Y[i]-y_mean)

错误输出

IndexError: index 697 is out of bounds for axis 0 with size 697

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。