《医学统计学》 > 第五章 标准误与可信区间

第一节 抽样误差与标准误

 

一、抽样误差的意义

在第一章第二节曾提到过样本与总体以及抽样误差的概念,那里谈到,由于存在人与人之间的个体差异,即使从同一总体用同样方法随机抽取例数相同的一些样本,各样本算得的某种指标,如平均数(或率),通常也参差不齐存在一定的差异。样本指标与相应的总体指标之间有或多或少的相差,这一点是不难理解的。如某医生从某地抽了120名12岁男孩,测量其身高,计算出均数为143.10cm,若再从该地抽120名12岁男孩,其平均身高未必仍等于143.10cm,也不一定恰好等于某市12岁男孩身高的总体均数,这种差异,即由于抽样而带来的样本与总体间的误差,统计上叫抽样波动或抽样误差。

抽样误差和系统误差不一样,关系系统误差,当人们一旦发现它之后,是可能找到产生原因而采取一定措施加以纠正的,抽样误差则无法避免。因为客观上既然存在个体差异,那么刚巧这一样本中多抽到几例数值大些的,所求样本均数就会稍大,另一样本多抽到几例数值小些,该样本均数就会稍小,这是不言而喻的。

抽样误差既是样本指标与总体指标之间的误差,那么抽样误差小就表示从样本算得的平均数或率与总体的较接近,有样本代表总体说明其特征的可靠性亦大。但是,通常总体均数或总体率我们并不知道,所以抽样误差的数量大小,不能直观地加以说明,只能通过抽样实验来了解抽样误差的规律性。

 

二、标准误及其计算

为了表示个体差异的大小,或者说表示某一变量变异程度的大小,可计算标准差等变异指标来说明,现在我们要表示抽样误差的大小,如要问,从同一总体抽取类似的许多样本,各样本均数(或各率)之间的变异程度如何?也可用变异指标来说明。这种指标是:

(一)均数的标准误 为了表示均数的抽样误差大小如何,用的一种指标称为均数的标准误。我们以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数这“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的散布情形,而标准误则说明样本均数的参差情况,两者不能混淆。下面用抽样实验进一步说明之。

将100名正常人的红细胞数(万/mm3)写在100颗大小均匀的豌豆上。这些红细胞数见表6.1,其均数为500,标准差为43。把这些豌豆放在一个口袋里,彻底混匀后取出一颗,记下红细胞数,放回袋内,混匀后再取出一颗,记下数字后再放回去,如此继续下去,这是一个取不完的总体,这样每取10个数字作为一个样本,共抽取了一百个样本,并计算每一样本的均数与标准差,例见表6.2。

表6.1 红细胞数抽样实验用的正态总体

μ=500 σ=43(单位:万/立方厘米)

383410422429430431435442442444
445449450452455456459461462463
465466468469470471472473476477
478479480481482484485486487488
489491492493494495496497498499
500501502503504505506507508509
511512513514515516518519520521
522523524527528529530531532534
535537538539541544545548550551
555556558565569578590599600617

表6.2 红细胞数抽样实验中的样本举例

样本号红细胞数(万/立方毫米),XXS
1383599534442435486478476509544488.661.65
2503506520503489410528488509527498.333.97
3478463617544498485496462482569509.450.96
4529465535473531532556521459383498.452.63
5442493462527520519521512482471494.929.51

第一号样本均数与标准差的计算:

X=4.886/10=488.6

将一百个样本均数加总,得到的数值为50,096.7,又这一百个样本均数平方之和为25,114,830.91,于是代入标准差的计算公式,求得一百个样本均数的标准差又称标准误为

当总体标准差已知时,可计算理论的标准误σχ,公式是

(6.1)

表6.1抽样实验用的总体标准差是43,每个样本的例数是10,代入公式得

可见由一百个样本均数求得的标准误13.50与理论的标准误13.60比较接近。

在实际工作中,总体标准差往往并不知道,也不象抽样实验那样从同一总体随机抽取n相等的许多样本,而是只有手头一个样本。在此情况下,只能以样本标准差S作为总体标准差σ的估计值。这样,公式6.1中的σ就要用S代替,σχ改为Sχ,以资区别。

(6.2)

将第1号样本的标准差及例数代入式6.2,得

再若将第2号样本的数字代入,Sχ将成为10.74,余类推。由于不同样本的标准差并不相等,可见Sχ也有抽样波动,这一点是值得注意的,但它仍不失为σχ的较好估计值。

以上介绍了求标准误的三种方法,其实我们平常用的只是式6.2,而通过前两种方法的对比则可使我们明瞭标准误的含义。标准误是描述样本均数变异情况的一个指标,它的大小与总体标准差σ(一般只能用S估计)成正比,而与样本含量n的平方根成反比,因此若标准差小或样本含量大时,求出的标准误就小(标准误小表示样本均数与总体均数较接近),X代表μ较可靠,所以假若手头资料中观察值的变异程度较大(S大)时,为了保

证样本代表总体比较可靠,就得适当增大样本含量(n)。

(二)率的标准误 若总体包括某事件的发生数与未发生数两类,所化成的比例或成数即为总体发生率(符号π)与未发生率(1-π)。从总体中随机抽取许多样本(n相等),算出各个样本率(用P表示),会是或大或小有波动的。为了表示样本率之间或样本率与总体率之间的差异程度,当总体率π已知时,可计算理论的标误σp,其公式是

(6.3)

实际工作中往往不知道总体率π这时只能以样本率P作为总体率π的估计值,求得率的标准误,并用SP表示,计算公式为

(6.4)

现举例说明其求法。

例6.1 某医生检测了110名成年健康人的尿紫质,发现阳性者11人,阴性者99人,于是算得阳性率P及率的标准误SP如下:

P=11/110×100%=10% (用小数表示为0.10)

若要进一步增强样本率估计总体率的可靠性,可加大样本含量。

 

三、样本均数的分布

从同一总体里随机抽取n相同的许多样本,这些样本均数吴正态分布。如前面所述正常人红细胞数的抽样实验中已求得100个样本均数,其中多数与总体均数μ比较接近而集中分布在其周围,且左右基本对称,见表6.3(此表由表6.4中的100个均数划记归组而得)。

表6.3 红细胞抽样实验中100个样本均数的分布

组 段460-470-480-490-500-510-520-530-540-合计
样本数1318282813711100

表6.4 一百个样本的均数、标准差、95%可信区间

样本号均数标准差95%可信区间样本号均数标准差95%可信区间
1488.661.65444.49~532.712498.333.97474.01~522.59
3509.450.96472.96~545.844498.452.63460.76~536.04
5494.929.51473.80~516.006°546.743.23515.78~577.62*
7524.533.60500.45~548.55*8488.341.04458.94~517.66
9485.355.14445.85~524.7510502.648.55467.88~537.32
11495.140.63466.03~524.1712524.737.81497.65~551.75
13512.753.18474.65~550.7514494.837.24468.15~521.45
15493.639.94465.03~522.1716495.329.47474.22~516.38
17491.019.32477.18~504.8218506.553.83468.00~545.00
19487.539.39461.32~517.6820495.932.70472.51~519.29
21504.834.76479.94~529.6622512.244.76483.17~547.23
23496.540.65467.41~525.5924499.837.04473.31~526.29
25505.737.21479.08~532.3226487.734.50463.02~512.38
27501.537.35474.79~528.2128476.129.64454.91~497.29*
29523.251.57486.31~560.0930509.533.61485.45~533.55
31494.228.60473.75~514.6532506.225.29483.10~524.30 
33501.127.88481.15~521.0534520.630.23498.98~542.22 
35492.042.18461.82~522.1836509.619.17495.89~523.31 
37488.642.29458.36~518.8438510.947.55476.88~544.92 
39516.439.96487.81~544.9940518.846.43485.59~552.01 
41495.936.89469.53~522.2742°526.442.78495.80~557.00 
43505.853.84467.30~544.3044503.047.33469.14~536.86 
45504.847.77470.62~538.9846492.429.20471.52~513.28 
47505.538.32478.08~532.9248486.552.98448.59~524.41 
49515.238.69487.51~542.8950487.053.75448.55~525.45 
51503.351.54466.43~540.1752491.058.47449.18~532.82 
53522.365.01475.79~568.8154490.349.92454.58~526.02 
55516.737.26490.05~543.3556489.631.41467.14~512.06 
57490.062.90445.01~534.9958489.230.91467.09~511.31 
59509.140.51480.12~538.0860513.529.18492.62~534.38 
61476.442.06446.32~506.4862511.528.46491.14~531.86 
63480.744.83448.62~512.7864501.429.00480.66~522.14 
65481.150.65444.86~517.3466496.036.53469.87~522.13 
67489.244.20457.58~520.8268494.829.73473.54~516.06 
69497.268.49448.21~546.1970504.135.13478.95~529.25 
71507.934.35483.33~532.4772°465.325.56447.02~483.58* 
73502.645.54470.03~535.1774486.448.51451.70~521.10 
75°526.632.68503.10~550.10*76503.247.18469.45~536.95 
77496.733.45472.77~520.6378504.843.52473.67~535.93 
79490.258.07448.67~531.7380486.626.60467.57~505.63 
81506.128.48485.72~526.4882513.729.28492.75~534.65 
83481.529.78460.19~502.8184491.244.73459.22~523.18 
85515.725.78497.26~534.1486513.964.62467.69~560.11 
87496.423.82479.37~513.4388507.445.14475.10~539.70 
89479.144.15465.52~528.6890498.930.16477.32~520.48 
91503.753.90465.16~542.2492495.930.86473.78~518.02 
93494.658.48452.78~536.4294507.142.44476.74~537.46 
95488.536.15462.65~514.3596489.168.01440.44~537.76 
97°530.158.72488.09~572.1198518.745.10486.44~550.96 
99507.841.87477.85~537.73100540.655.17465.13~544.07 

已知按正态分布,理论上有95%的变量值分布在均数加、减1.96倍标准差(样本均数的标准差称标准误)的范围内,这里也即100个样本均数中有95个分布在500-1.96(13.60)=473.34至500+1.96(13.60)=526.66的范围内。现看表6.4,在100个样本均数中,第6号(546.7)、第72号(465.3)、第97号(530.1)在上述范围之外,第42号(526.4)及第75号(526.6)就在临界值附近,其余95个(若将第42及75号计算在内则为97个)样本均数在此范围之内,将实际分布与理论分布相对照见下表6.5。100个样本均数的实际分布与正态分布的理论基本符合。