如何解决代表错误X,时间=天花板长度Y/长度X:尝试在线性回归的交叉验证中复制“闭包”类型的对象
我想为我的练习预测 snp101。我不需要使用一个好的模型,只需要一个可以工作并返回我预测的收盘价与给定日期之间的相关性的模型。我需要为此编写一个函数,在该函数中我想应用交叉验证过程来找到使用 poly() 的最佳模型
我附上了关于我的数据是如何构建的说明。
参数:
每个公司 1 行的 data.frame。
Symbol 包含标准普尔符号为公司,名称包含完整的公司名称
每个日期是一个单独的列,带有日期出现在格式XYYYYY.MM.DD
这很重要,因为我运行的代码适用于另一个数据框的交叉验证,但不适用于这个数据框。因此,我认为问题出在我的数据结构内。
这是我编写的代码,用于创建结束值作为预测变量和日期作为预测变量(时间:
predicted <- data.frame(Symbol = data_2020$Symbol,predVal = 0)
for (name in data_2020$Symbol) {
tempData <- data.frame(date = c(1:7),close = as.numeric(data_2020[data_2020$Symbol == name,3:9]) )
我写了 7 天,因为我需要预测数据框的最后一天之后的 7 天。
这是我尝试运行的交叉验证,但出现此错误:
代表错误(X,次=天花板(长度(Y)/长度(X))): 尝试复制“闭包”类型的对象。
当我尝试调试时,我发现它来自 lm 函数行。 我很想知道我的数据/创建的预测变量有什么问题会返回这个错误。
n_data = nrow(data_2020)
max_poly = 7 # The highest degree we'll fit
mse = rep(NA,max_poly) # MSE vector
bic_value = rep(NA,max_poly) # BIC vector
log_lik = rep(NA,max_poly) # log likelihood vector
predicted = matrix(rep(NA,max_poly*n_data),nrow = n_data) # Matrix for all predicted points,for all degrees
for (j in 1:max_poly) { # For each degree
# Leave-one-out
for (i in 1:n_data){
# Fit the model for all data but one point
m = lm(data_2020[-i,],formula = close ~ poly(date,j,raw = T))
# Predict the left out point
predicted[i,j] = predict.lm(m,newdata = data_2020[i,])
}
# Calculate cross-validated MSE
mse[j] = mean((predicted[,j] - data_2020$close)^2)
# Plot the model fitted with the full data
p = ggplot(data = data_2020,aes(x = date,y = close)) +
geom_point() +
geom_smooth(method = "lm",formula = y ~ poly(x,raw = T),se = F)
show(p)
# Calculate the full model
m = lm(data_2020,raw = T))
# Save the BIC value
bic_value[j] = BIC(m)
# Save the log likelihood
log_lik[j] = logLik(m)
} ```
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。