如何解决autoplot.survfit 是否应该用于多阶段分层?
我相信我在 ggfortify 中发现了一个错误,但我想在向开发人员发送请求之前由专家运行它。
这是可能的错误:
调用 autoplot.survfit 绘制 survfit 对象(来自“survival”包)时,只要有多层分层就会出错。
这是一个reprex:
# Package installations
# install.packages("survival")
# install.packages("ggfortify")
# install.packages("asympTest")
# Load packages
library(survival) # Survival analysis
library(ggfortify) # Package in question
library(asympTest) # Contains dataset
# Load dataset
dsNames <- data(DIGdata)
dig <- DIGdata
dig$KLevelGrp <- dig$KLEVEL > 4.3
# Create survival objects
survObject <- Surv(time = dig$DWHFDAYS,event = dig$DWHF)
survCurve <- survfit.formula(survObject ~ TRTMT + KLevelGrp,data = dig)
# Reproduce bug
autoplot(survCurve)
# Error in `levels<-`(`*tmP*`,value = as.character(levels)) :
# factor level [3] is duplicated
这是我认为正在发生的事情: 函数 autoplot.survfit 调用 fortify.survfit 来处理 survfit 对象。 fortify.survfit 的第 33-34 行(来自 getS3method("fortify","survfit") 的行号)读取:
groupIDs <- gsub(".*=","",names(model$strata))
groupIDs <- factor(rep(groupIDs,model$strata),levels = groupIDs)
survfit.formula 函数对两个分层变量的默认分层命名为 "var1=value1,var2=value2"
。此 gsub
调用将子字符串 "var1=value1,var2="
替换为空字符串。这会导致地层 "var1=0,var2=0"
和 "var1=1,var2=0"
都减少到 "0"
。这会导致 groupID 的值重复,这意味着它不是 levels
的有效 factor
参数。
谢谢,
凯伦
附注。将 names(survCurve$strata)
改为使用冒号是一种简单的解决方法。我不是在寻找解决方案,我只是在问我是否应该向开发人员报告这个问题。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。