您的当前位置：首页正文

cox回归模型的样本含量的计算方法及软件实现

来源：哗拓教育

COX回归模型的样本含量的计算方法及软件

实现

【摘要】

目前生存分析中COX回归模型到底需要多少样本量

COX回归模型所需

往往靠经验法来估计。旨在介绍并推广生存分析中

样本量的计算公式及其目前可以实现该计算方法的软件，并通过实例说明了该公式的应用，以期提高今后研究工作的效率。

【关键词】生存分析； COX回归模型；样本量；统计软件

COX回归模型在生存分析中应用非常广泛，然而，关于应用

该模型到底需要多少样本含量的问题一直未得到很好地解决。主要原因就是生存分析中往往涉及到数据删失的问题，如果不考虑删失数据，则可以利用率的比较所需样本量的计算公式。但是，简单的忽略这部分数据，往往会造成信息的损失。如果考虑删失数据，则样本量的计算又变得非常复杂，因此，直到今天，这个问题依然是国内外统计学者研究的热点之一。本研究仅介绍其中一种较为成熟的计算方法及其相应的实现软件，并通过实例说明该公式应该逐渐被研究者们广泛应用，从而达到提高研究效率的目的。

1 公式介绍

以往，对于COX回归模型所需的样本量往往凭经验去估计，

即至少需要相当于协变量个数Schoenfeld在Biometrics

10～15倍的阳性结局事件。1983年，

杂志上撰文，提出了一个计算比例风险模

型样本含量的公式［1，2］：

D=(Z1-α+Zβ)2［P(1-P)logΔ)2］-1

这里，D是指发生阳性结局的总人数，P是指分配到第一治疗

组人数所占的比例。logΔ是指风险比的对数。该公式主要是用来计算随机化分组研究的设计所需的样本量，适用于二分类自变量。同时，当考虑其他协变量对生存时间的影响时，则要求主要感兴趣的研究变量与其他变量间相互独立。

然而，在实际的工作当中，变量之间有时并不能满足独立性。

因此，2000年，Hsieh和Lavori在Controlled Clinical Trials将Schoenfeld的计算公式进行了扩展［3］，现介绍如下：

上

N=(Z1-α/2+Z1-β)2P(1-R2)σ2B2

等号左边，N表示所需要的样本含量。

等号右边Z1-α/2,Zβ表示给定检验水准和检验功效时的z

界值；P表示整个研究期间阳性结局事件的发生率；B表示对数风险比，

即logΔ；σ2表示感兴趣的研究因素X1的方差，这里假定X1服从正

态分布，对于非正态分布的X1，如二项分布，可通过p(1-p)进行估计，这里，p表示X1取“0”或“1”的比例。与Schoenfeld的计算公式不同的是，该公式引入了“方差膨胀因子”（VIF），即1/（1-R2）。R2表示X1对其他协变量作回归分析时的确定系数，取值范围取值为“0”时，一般表示只考虑一个自变量间不满足独立性时，需要通过

0～1，当

X1的情形。亦即当变量

VIF来增加参数估计值的方差。

上述各指标可通过查阅相关文献或进行预试验确定。

2 软件实现

目前，有许多统计软件可以用来计算生存分析所需的样本量，

但是大部分软件都是针对指数分布，比如S

log

rank检验的，或是要求生存时间服从

plus、PS、NQuery Advisor、STATA、PASS等。

COX回归分析所需样本量的

然而，逐渐地也有不少软件开始引入针对

计算程序，比如STATA和PASS。现介绍如下：

2.1 STATA软件的应用

程序如下：stpower COX ［coef］［, options］

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文