当前位置: 首页>前端>正文

生存分析8-参数模型

Cox回归模型为半参数模型,它不对基线风险函数进行估计。如果生存资料确实符合某一特定分布,采用实际分布能够更准确的估计对应参数。对半参数回归对应为参数模型(parameteric models)。包括指数分布和weibull分布等。

-各个函数之间的关系

?????- 死亡概率密度函数: 生存分析8-参数模型,f(t)=lim_{△t->0}P(t≤T<t+△t),第1张

?????- 死亡累积概率密度函数:生存分析8-参数模型,F(t)=\int_0^tf(u)du,第2张

?????- 生存函数:生存分析8-参数模型,S(t)=P(T>t)=1-P(T≤t)=1-F(t),第3张

?????- 风险函数:生存分析8-参数模型,h(t)=\frac{f(t)}{S(t)}=lim_{△t->0}P(\frac{t≤T<t+△t}{△t}),第4张

?????- 累积风险函数:生存分析8-参数模型,H(t)=\int_0^th(u)du,第5张

?????- 生存函数与累积风险函数的关系:生存分析8-参数模型,S(t)=exp(-H(t)),H(t)=-log(S(t)),第6张

-指数分布

?????-概率密度函数:生存分析8-参数模型,f(t)=λe^{-λt},第7张

?????-累积概率密度函数:生存分析8-参数模型,F(t)=1-e^{-λt},第8张F(t)求导为f(t))

?????-生存函数:生存分析8-参数模型,S(t)=1-F(t)=e^{-λt},第9张

?????-风险函数:生存分析8-参数模型,h(t)=\frac{f(t)}{S(t)}=λ,第10张,由此可见指数分布的风险恒定为λ

?????-累积风险函数:生存分析8-参数模型,H(t)=\int_0^tf(u)du=λt,第11张

?????-中位数:生存分析8-参数模型,F(t)=0.5; 1-e^{-λt}=0.5; t=\frac{ln(2)}{λ}=median,第12张

?????-均值:生存分析8-参数模型,mean=\frac{1}{λ},第13张

?????由生存函数可得, -log{S(t)}=λt,即与生存时间t呈线性。因此可以通过对-log(S(t))与t绘图是否呈过原点的直线来判断该生存资料是否符合指数分布。
?????SAS中通过proc lifetest data=XX plots=(logsurv) 绘图实现。

-威布尔分布

?????- 死亡概率密度函数: 生存分析8-参数模型,f(t)=γλt^{γ-1}exp(λt^γ),第14张

?????- 死亡累积概率密度函数:生存分析8-参数模型,F(t)=exp(-λt^γ),第15张

?????- 生存函数:生存分析8-参数模型,S(t)=exp(-λt^γ),第16张

?????- 风险函数:生存分析8-参数模型,h(t)=λγt^{γ-1},第17张

?????当γ=1时,为指数分布。
?????分布具有两个参数:
??????????γ:Shape parameter
??????????λ:Scale parameter
??????????中位数:生存分析8-参数模型,t(50)=(\frac{1}{λ}log2)^\frac{1}{γ},第18张

?????对生存函数取log(-log):生存分析8-参数模型,log(-logS(t))=γlogλ+γlogt,第19张。当生存分析8-参数模型,log(-logS(t)),第20张生存分析8-参数模型,logt,第21张呈直线时,可以考虑符合weibull分布。该图的截距为logλ近似估计参数λ,斜率近似为γ。如果两条线平行,则考虑符合等比例风险假设。 ?????当斜率γ=1,此时为指数分布。生存分析8-参数模型,log(-logS(t))=logλ+logt=logλt,第22张

-参数估计

均通过极大似然估计(Maximum likelihood estimation)求参数。似然函数
??????????????????????????????????????????????????????????????生存分析8-参数模型,\prod_{i=1}^nf_{Ti}(ti)^{δi}S_{Ti}(ti)^{1-δi},第23张
其中n为受试者数,δi=1(事件发生),δi=0(删失)。将对应的f(t)及S(t)带入后求极大值(求对数后求导,导数为0时即最大值)

指数分布
生存分析8-参数模型,第24张

e.g.

变量
生存分析8-参数模型,t_i,第25张 1 1 2 3 3 5 8 10 16 18
生存分析8-参数模型,δ_i,第26张 1 1 1 0 1 1 1 1 0 1

生存分析8-参数模型,λ=\frac{8}{1+...+18},第27张

生存分析8-参数模型,S(t)=e^{-0.2294t},第28张

Weibull分布

weibull分布的参数估计需要通过迭代的方法计算。

-引入协变量

当生存资料中除时间以外还存在其他变量的影响时,需要将变量考虑进回归模型。与Cox回归类似。
由于时间t不为负,将其取对数后变换为在(-∞,∞)之间,可以采用线性回归模型(对数时间线性模型)。
生存分析8-参数模型,lnT=a_0+a_1x_1+ ... +a_mx_m+\sigma\varepsilon,第29张生存分析8-参数模型,\sigma,第30张为常数,生存分析8-参数模型,\varepsilon,第31张为随机误差服从某一特定分布。
生存分析8-参数模型,T=exp(a_0+a_1x_1+ ... +a_mx_m+\sigma\varepsilon)=exp(a,第32张 ,当所有协变量为0时为不受协变量影响时的基准生存时间,生存分析8-参数模型,a_0,第33张需要包括在模型中。

*加速失效模型
*生存分析8-参数模型,\varepsilon,第31张服从极值分布生存分析8-参数模型,f_\varepsilon=e^{x-e^x},第35张时,对应指数分布和weibull分布

指数分布:当生存分析8-参数模型,\sigma=1,第36张时,生存分析8-参数模型,\varepsilon,第31张的分布为生存分析8-参数模型,f_\varepsilon=e^{x-e^x},第35张时,为指数分布 生存分析8-参数模型,f(t)=λexp(-λt),第39张生存分析8-参数模型,λ=exp(-(a_0+a_1x_1+ . . .+a_mx_m)),第40张

weibull分布:当生存分析8-参数模型,\sigma,第30张为常数(需要从数据中估计),生存分析8-参数模型,\varepsilon,第31张分布不变,
为weibull分布 生存分析8-参数模型,f(t)=γλt^{γ-1}exp(λt^γ),第14张生存分析8-参数模型,h(t)=λγt^{γ-1},第17张
生存分析8-参数模型,γ=1/\sigma,第45张生存分析8-参数模型,λ=exp(-(a_0+a_1x_1+ . . .+a_mx_m)/\sigma)),第46张
表示为风险函数:生存分析8-参数模型,h_i(t)=exp((β_1x_1+ . . .+β_mx_m)h_0(t),第47张=生存分析8-参数模型,exp(β,第48张,此时scale变为λexp(β'x'),shape仍为γ不变。当所有协变量为0时,基准风险率为生存分析8-参数模型,h_0(t),第49张,此时模型中不需要包括生存分析8-参数模型,β_0,第50张

-SAS 实现

Proc lifereg data=XXX
Class XX;
model timestatus()=XX XX /dist=exponential;
model time
status()=XX XX /dist=weibull;
run;
计算出线性模型中生存分析8-参数模型,a_0, a_1, . . . , a_m, \sigma,第51张后,可以通过相应的公式估算生存分析8-参数模型,γ,第52张生存分析8-参数模型,λ,第53张的值。


https://www.xamrdz.com/web/2cv1997231.html

相关文章: