分层比例风险模型(Stratified Proportional hazards models)
比例风险(Proportional hazard):协变量对风险比的影响不随时间而变化
非比例风险(Non-Proportional hazard):风险比随时间的变化而变化
Cox回归使用广泛,但前提要满足比例风险假设,如果不符合需要采用其他的分析方法,如加速失效模型(accelerated failure time model),其中的指数回归和weibull既属于加速失效模型同时也符合等比例风险假设;在Cox回归中加入时依变量(time-dependent variable)等。
-分层Cox回归
风险比在不同分层间不成比例,但在层内符合比例风险且各个分层间的基线风险函数可以不同。分层的变量需为分类变量,因为按照不同的层进行了分析,该分层因素的效应不能估计。分层因素如各个不同的中心。
假设第j个分层的某个受试者的基线风险为,j=1,2, ..., g,g为分层的数量。
则第i个受试者的风险为,,为第j个分层的受试者总数。
分层比例风险模型表示为:
?????????????????????????????????????????????
为p个协变量, X1, X2, ..., Xp 为第j个分层第i个受试者的取值。
*校正的生存函数
?????通常生存分析中,通过K-M法估计生存率,绘制生存曲线或者分层后的生存曲线,K-M不考虑协变量的校正。通过Cox回归校正协变量,获得矫正或者未校正后的HR。
?????如果想要估计协变量校正后的生存率,则在Cox回归模型相关参数估计完成后,可以进一步通过这些参数估计生存函数,可以与未校正的K-M估计进行比较。
?????即校正风险后的生存函数(Risk adjusted survivor function),在各个时间点所有受试者生存率的平均值。
?????在时刻t时,某受试者的风险函数为
?????转换为生存率:
当Cox模型用于g个组间的比较
此时为第j个组的基线风险函数,即各个组的基线风险函数不同。但β1, β2, ..., βp在各个组间仍是相同的。
对应为分层Cox回归(Stratified Cox regression model),j为某一变量对应的g个分层,即对g个分层分别进行分析,模型中的xi不包括组别变量(这里指分层变量),仅估计协变量的参数β。对应生存率估计为
-SAS实现
SAS中通过STRATA语句实现
The proportional hazards assumption might not be realistic for all data. If so, it might still be reasonable to perform a stratified analysis. The STRATA statement names the variables that determine the stratification
The STRATA statement enables us to fit a proportional hazards model when the hazard functions in the two treatment groups are parallel within each stratum but not across the entire sample.
增加Strata后的β系数估计只有一个结果。因为分层Cox回归假定的是系数在各个分层间相同,只是每个分层都有不同的基线风险模型。将协变量放入模型(Strata中的变量不放入model),进行系数估计后,再计算不同分层的风险比或生存率。
而如果将Strata中的变量放出model右侧,则采用的是常规的COX回归,假设的各个分层的基线风险函数是相同的。