临床预测模型的决策曲线分析(DCA):基于ggDCA包
决策曲线分析法(decision curve analysis,DCA)是一种评估临床预测模型、诊断试验和分子标记物的简单方法。 我们在传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。

前 言

本文介绍使用ggDCA包绘制多因素Cox回归模型的决策曲线分析(Decision curve analysis,DCA)。

ggDCA是目前能同时绘制Cox回归模型、logistic回归模型及广义线性模型的DCA曲线且其图形能用ggplot2美化。同时,该包还能计算DCA的曲线下面积、净获益及阈值概率的范围,如果把这些加入到文章中相信能增色不少!

1. 预测模型评估小结

2. ggDCA包的安装

3. Cox回归模型的DCA

4. 单个Cox模型多个时间点的DCA

5. 多个Cox回归模型的DCA比较

6. 多个模型在多个时间的DCA比较

7. DCA的曲线下面积(AUDC)

8. 其他回归模型的DCA

一、模型评估与比较小结

举例:某列线图(AUC/C-inde=0.8)预测某患者5年复发风险为70%。

1. 区分度 (Discrimination)

使用ROC曲线的曲线下面积(AUC)和C-index评估。

AUC/C-index=0.8,列线图对此结果的区分能力为80%,即有80%的把握确定复发率为70%。预测模型 | 6. 模型评估:ROC曲线-基于多因素Cox回归

2. 校准度 (Calibration)

使用校准图评估。

校准图用于解释列线图预测的70%复发率与实际复发率的接近程度,即准确性评估。详见:预测模型 | 5. 模型评估:校准曲线

3. 临床实用性

(Clinical usefulness)

使用决策曲线分析(DCA)评估。

多因素Cox回归的DCA曲线

#载入R包
ibrary(rms)
library(ggDCA)
library(survival)  

#清理环境
rm(list = ls()) 

#2.载入数据,status=0为复发
aa<- read.csv('决策分析曲线.CSV')

#使用cph()函数时运行
#即报错:adjustment values not defined here or with datadist.....时
bb<-datadist(aa)
options(datadist='bb')
数据点击:https://mp.weixin.qq.com/s/VO3GiBZcL_kAoHrr6_dPAw获取

1、构建多因素Cox回归模型

数据中status,0为感兴趣事件,因此status==0

model1<-coxph(Surv(time,status==0)~AGE+N+ER+LVI+Grade+RT,
                data=aa)

2、决策曲线分析 DCA

fig1<-dca(model1,
           new.data = NULL,
           times=60)

3、DCA曲线绘制和美化

ggplot(dca1,       
       model.names="模型1",
       linetype =F, #线型
       lwd = 1.2)   #线粗

R cox回归 ggDCA报错-LMLPHP

2.png


4. 美化

library(ggprism)
ggplot(dca1,linetype =F,lwd = 1.2)+
  #使用直线坐标系    
  theme_classic()+  
  #使用prism主题
  theme_prism(base_size =17)+
  #图例放在上方
  theme(legend.position="top")+
  #x轴范围并加入小刻度
  scale_x_continuous(
    limits = c(0, 1),
    guide = "prism_minor") +
  #y轴范围并加入小刻度
  scale_y_continuous(
    limits = c(-0.01, 0.2),
    guide = "prism_minor")+
  #颜色
  scale_colour_prism(         
    palette = "candy_bright",
    name = "Cylinders",
    label = c("模型1", "ALL", "None"))+
  #图形标题
  labs(title = "5年DCA基于ggDCA包")

R cox回归 ggDCA报错-LMLPHP

3.png


更多细节点击查看原文:https://t.1yb.co/nAm1

四、单个模型多个时间点的DCA

#第1步建模同上
#第2步同上,只需改时间即可
dca1<-dca(model1,
           new.data = NULL,
           times=c(36,48,60))
#第3步改标签
ggplot(dca1,
       linetype =F,
       lwd = 1.2)+
  theme_classic()+  
  theme_prism(base_size =15)+
  theme(legend.position=c(0.7,0.7))+
  scale_x_continuous(
    limits = c(0, 1),
    guide = "prism_minor") +
  scale_y_continuous(
    limits = c(-0.01, 0.15),
    guide = "prism_minor")+
  scale_colour_prism(
    palette = "candy_bright",
    name = "Cylinders",
    label = c("3年DCA","4年DCA","5年DCA", 
              "ALL-3年", "ALL-4年","ALL-5年",
              "None"))+
  labs(title = "3-5年DCA")

R cox回归 ggDCA报错-LMLPHP

五、多个模型DCA比较

#再建两个模型
model2 <- coxph(Surv(time,status==0)~AGE+N+ER+PR+Grade,data=aa)
model3 <- coxph(Surv(time,status==0)~AGE+N+ER+LVI,data=aa)
#三模型DCA分析
#只需指明模型名字和时间即可,跟1个模型一样其实
dca2<- dca(model1,model2,model3,
            times=60)
#绘图,跟单模型一样的代码
ggplot(dca2,
       linetype =F,
       lwd = 1.2)+theme_classic()+  
  theme_prism(base_size =17)+
  theme(legend.position=c(0.8,0.6))+
  scale_x_continuous(
    limits = c(0, 1),
    guide = "prism_minor"
  ) +
  scale_y_continuous(
    limits = c(-0.01, 0.15),
    guide = "prism_minor"
  )+
  scale_colour_prism(
    palette = "candy_bright",
    name = "Cylinders",
    label = c("模型1", "模型2", "模型3","ALL","None")
  )+labs(title = "三模型DCA比较")

R cox回归 ggDCA报错-LMLPHP

六、多模型多时间点DCA比较

#只需修改一下时间和标题
dca2<- dca(model1,model2,model3,times=c(36,48,60))

ggplot(dca2,
       linetype =F,
       lwd = 1.2)+theme_classic()+  
  theme_prism(base_size =17)+
  theme(legend.position=c(0.9,0.6))+
  scale_x_continuous(
    limits = c(0, 1),
    guide = "prism_minor"
  ) +
  scale_y_continuous(
    limits = c(-0.01, 0.15),
    guide = "prism_minor"
  )+
  scale_colour_prism(
    palette = "candy_bright",
    name = "Cylinders",
    label = c("模型1", "模型2", "模型3","ALL","None")
  )+labs(title = "三个模型3-5年DCA比较")

R cox回归 ggDCA报错-LMLPHP

七、曲线下面积及净获益范围

model1<-cph(Surv(time,status==0)~AGE+N+ER+LVI+Grade+RT,
                data=aa)
dca1<-dca(model1,times=60)
AUDC(dca1)

#运行结果
#   model1        All       None 
#0.06035219 0.01139759 0.00000000
rFP.p100(dca1)

#也可以直接输入dca1
dca1

R cox回归 ggDCA报错-LMLPHP

基于这个数据框,我们可以比较各个模型在各个时间点的阈值概率范围,最大最小净获益。

在我读过的文章里,这些数据很少被报道。

这项结果也是ggDCA包的一大特色。

这些数据将使我们的文章更具亮点和说服力。

八、其他回归模型的DCA曲线

bb<-datadist(aa)
options(datadist='bb')
#建模
m1<- lrm(status~AGE+N+LVI+Grade,data = aa)
m2<- lrm(status~AGE,data = aa)
#dca分析
d<-dca(m1,m2 )
#绘图
ggplot(d)+
  theme_classic()+  
  theme_prism(base_size =17)+
  theme(legend.position=c(0.25,0.3))+
  scale_x_continuous(
    limits = c(0.2, 1),
    guide = "prism_minor"
  ) +
  scale_y_continuous(
    limits = c(-0.05, 0.8),
    guide = "prism_minor"
  )+
  scale_colour_prism(
    palette = "candy_bright",
    name = "Cylinders",
    label = c("lrm模型1", "lrm模型2","ALL","None")

ggDCA包参考手册:

https://cran.r-project.org/web/packages/ggDCA/index.html

https://mp.weixin.qq.com/s?__biz=Mzg2MjU2NDQwMg==&mid=100010922&idx=1&sn=eae80cc7ab9e3fd2d66864609520921b&chksm=4e0752f77970dbe170cf969ab9baaf1dbbca8953ff4c2502e54595db5cffec4dc17f76267226#rd

错误1 

Error in model.frame.default(formula = Surv(time, event) ~ data + new_model_by_liang_guo,  :
  参数'data'的种类(list)不对

这个错误来源于

model_Liang_Guo <- coxph(Surv(time, event)~data$new_model_by_liang_guo,data=data)
summary(model_Liang_Guo)

去掉datas$  即可

ggDCA的包报错

R cox回归 ggDCA报错-LMLPHP

由于survival包版本问题,从CRAN安装的ggDCA会报错(如上图)。

因此,要从作者的github上下载ggDCA

ggDCA安装

#1.安装devtools
install.packages("devtools")
#2.从github安装ggDCA
devtools::install_github('yikeshu0611/ggDCA')

#注:若是devtools::install_github('yikeshu0611/ggDCA')也报错,可先运行:
options(unzip ='internal')
 
02-22 07:31