《流行病学》 > 附录五　分析流行病学有关计算

附录五　分析流行病学有关计算

（一）OR、OR_MH的可信限和OR_i的齐性检验

⒈Miettinen法　即是以显着性检验为基础的（test-based）可信限。计算OR_MH的100（1-α）％可信限公式

此公式同样可用于计算单个OR（即从一张四格表数据算出的OR）的可信限。这时，上式中用OR代替ORMH，用x²代替X²_Mh。匹配数据的OR也可同样计算。用函数型电子计算器来算，都很简单。

式中的U，可查标准正态差简表（附表5-1），U_α/2可查α/2单侧检验的U_α值。最常用的95％可信限按下式计算（上限记为OR_U，或OR，下限记为OR_L或OR）:

标准正态差简表

附录5-1　标准正态差简表

* 双侧检验时U_β值与单侧检验时相同

计算实例：表4-4的数据，OR_MH＝5.55，x²_MH＝76.84，95％可信限：

2. Woolf法　即自然对数转换法

（1)首先把OR转移为自然对数，记为lnOR；

(2)按下式求出lnOR的方差，记为Vαr(lnOR)：

即四格表中每一格数值的倒数之和。倘有某一格的数值为0时，可在每格的数值上各加0.5，再求出它们的倒数之和。

⑶lnOR的100(1-α)％可信限为

如为求95％可信限，上面两式中U_α/2＝1.96；

(4)最后各取其反对数（e^X），即为OR的可信限。

(5)也可直接用下式算可信限：

以上都是用于计算不分层OR（粗OR）的公式，如为分层的数据也可用Woolf法计算各层lnOR_i的加权平均数及其可信限；同时可检验各层OR_i是否有齐性，即是否没有显著差异，倘有齐性，计算总的OR才有意义。

计算实例：仍用表4-4的数据，用公式（附式5-4）与（附式5-5）分别算出吸烟者与不吸烟者两层中饮酒与食管癌的OR及其对数（lnOR）以及lnOR的方差和方差的倒数（w_i权重），结果列表如下：

总的OR用下式计算：

将上表数据代入：

结果与OR_MH(5.55)相当接近。再按下式求OR的标准误：

（附式5-9）

得S_x(lnOR)=0.2169,于是lnOR的95％可信限lnOR±1.96S_x,代入得2.09，1.24，于是

与OR_MH的95％可信限（8.09,3.81）也十分接近。

但是各层的OR_i相关悬殊，或即吸烟者与不吸烟者中饮酒与食管癌联系强度差异较大，这种差异是随机变异的机会有多大？可以用下式作x²检验：

（附式5-10）

式中k＝层数，自由度＝k－1。

代入本例数据，x²＝5.06，5.06>x²(1，0.025)，p<0.025，各层间的OR差异显著，来自同一总体的可能性很小，所以总的OR不能说明吸烟、饮酒与食管癌的联系，因此是无意义的。

上述x²检验同时可用来检验各因素间是否存在交互作用。本例的结果提示吸烟与饮食这两个因子与食管癌危险度的联系有交互作用。

以上两种方法算得的都是似可信限，但在OR靠近无效值⑴的情况下，特别是在样本较大时，近似法与精确法所得结果十分接近。

⒊ 匹配数据的OR可信限

可用Miettinen法〔以显著性检验为基础的方法，公式（附式5-1）〕，实例见第四章表4-11的数据分析。还可用下述方法：

(1)先算方差：

(2)OR 的（1－α）％可信限

计算实例：仍用表4-11的数据，计算OR的95％可信限。U_α/2＝1.96，OR＝1.71，Var(lnOR)＝(60＋35)/(60×35)＝0.0452，

结果与用公式（附式5-1）算得的（1.14，2.57）很接近，而且理论上更恰当。

（二）病例对照研究样本含量的估计

所谓样本含量估计是指在满足一定条件下的一个粗略估计数；条件变动时估计数会随之发生变化，所以只有相对意义，而不能看作是保证可达到目的的准确数值。

样本含量（n）的估计须根据①对照人群的预防暴露率，p0；②暴露与疾病的联系程度，以RR为指标；③假阳性率，即Ⅰ型误差，α；④假阳性率，即Ⅱ型误差，β。

1.非匹配设计病例数与对照数相等时每组所需人数

非匹配设计病例数与对照数相等时每组所需人数

式中P₁＝P₀RR/[1＋P₀(RR－1)]，p＝0.5(P₁＋P₀)，q＝1－P₀。U_α与U_β可查附表5-1。有时也可不用公式，通过查表即可得n，例如附表5-2。

附表5-2　病例对照研究样本含量（非匹配，病例组与

对照组人数相等时每组需要人数）