第六章 标准误与可信区间
第一节 抽样误差与标准误
一、抽样误差的意义
在第一章第二节曾提到过样本与总体以及抽样误差的概念,那里谈到,由于存在人与人之间的个体差异,即使从同一总体用同样方法随机抽取例数相同的一些样本,各样本算得的某种指标,如平均数(或率),通常也参差不齐存在一定的差异。样本指标与相应的总体指标之间有或多或少的相差,这一点是不难理解的。如某医生从某地抽了120名12岁男孩,测量其身高,计算出均数为143.10cm,若再从该地抽120名12岁男孩,其平均身高未必仍等于143.10cm,也不一定恰好等于某市12岁男孩身高的总体均数,这种差异,即由于抽样而带来的样本与总体间的误差,统计上叫抽样波动或抽样误差。
抽样误差和系统误差不一样,关系系统误差,当人们一旦发现它之后,是可能找到产生原因而采取一定措施加以纠正的,抽样误差则无法避免。因为客观上既然存在个体差异,那么刚巧这一样本中多抽到几例数值大些的,所求样本均数就会稍大,另一样本多抽到几例数值小些,该样本均数就会稍小,这是不言而喻的。
抽样误差既是样本指标与总体指标之间的误差,那么抽样误差小就表示从样本算得的平均数或率与总体的较接近,有样本代表总体说明其特征的可靠性亦大。但是,通常总体均数或总体率我们并不知道,所以抽样误差的数量大小,不能直观地加以说明,只能通过抽样实验来了解抽样误差的规律性。
二、标准误及其计算
为了表示个体差异的大小,或者说表示某一变量变异程度的大小,可计算标准差等变异指标来说明,现在我们要表示抽样误差的大小,如要问,从同一总体抽取类似的许多样本,各样本均数(或各率)之间的变异程度如何?也可用变异指标来说明。这种指标是:
(一)均数的标准误 为了表示均数的抽样误差大小如何,用的一种指标称为均数的标准误。我们以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数这“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的散布情形,而标准误则说明样本均数的参差情况,两者不能混淆。下面用抽样实验进一步说明之。
将100名正常人的红细胞数(万/mm3)写在100颗大小均匀的豌豆上。这些红细胞数见表6.1,其均数为500,标准差为43。把这些豌豆放在一个口袋里,彻底混匀后取出一颗,记下红细胞数,放回袋内,混匀后再取出一颗,记下数字后再放回去,如此继续下去,这是一个取不完的总体,这样每取10个数字作为一个样本,共抽取了一百个样本,并计算每一样本的均数与标准差,例见表6.2。
表6.1 红细胞数抽样实验用的正态总体
μ=500 σ=43(单位:万/立方厘米)
383 |
410 |
422 |
429 |
430 |
431 |
435 |
442 |
442 |
444 |
445 |
449 |
450 |
452 |
455 |
456 |
459 |
461 |
462 |
463 |
465 |
466 |
468 |
469 |
470 |
471 |
472 |
473 |
476 |
477 |
478 |
479 |
480 |
481 |
482 |
484 |
485 |
486 |
487 |
488 |
489 |
491 |
492 |
493 |
494 |
495 |
496 |
497 |
498 |
499 |
500 |
501 |
502 |
503 |
504 |
505 |
506 |
507 |
508 |
509 |
511 |
512 |
513 |
514 |
515 |
516 |
518 |
519 |
520 |
521 |
522 |
523 |
524 |
527 |
528 |
529 |
530 |
531 |
532 |
534 |
535 |
537 |
538 |
539 |
541 |
544 |
545 |
548 |
550 |
551 |
555 |
556 |
558 |
565 |
569 |
578 |
590 |
599 |
600 |
617 |
表6.2 红细胞数抽样实验中的样本举例
样本号 |
红细胞数(万/立方毫米),X |
X |
S |
1 |
383 |
599 |
534 |
442 |
435 |
486 |
478 |
476 |
509 |
544 |
488.6 |
61.65 |
2 |
503 |
506 |
520 |
503 |
489 |
410 |
528 |
488 |
509 |
527 |
498.3 |
33.97 |
3 |
478 |
463 |
617 |
544 |
498 |
485 |
496 |
462 |
482 |
569 |
509.4 |
50.96 |
4 |
529 |
465 |
535 |
473 |
531 |
532 |
556 |
521 |
459 |
383 |
498.4 |
52.63 |
5 |
442 |
493 |
462 |
527 |
520 |
519 |
521 |
512 |
482 |
471 |
494.9 |
29.51 |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
┇ |
第一号样本均数与标准差的计算:
X=4.886/10=488.6
将一百个样本均数加总,得到的数值为50,096.7,又这一百个样本均数平方之和为25,114,830.91,于是代入标准差的计算公式,求得一百个样本均数的标准差又称标准误为
当总体标准差已知时,可计算理论的标准误σχ,公式是
(6.1)
表6.1抽样实验用的总体标准差是43,每个样本的例数是10,代入公式得
可见由一百个样本均数求得的标准误13.50与理论的标准误13.60比较接近。
在实际工作中,总体标准差往往并不知道,也不象抽样实验那样从同一总体随机抽取n相等的许多样本,而是只有手头一个样本。在此情况下,只能以样本标准差S作为总体标准差σ的估计值。这样,公式6.1中的σ就要用S代替,σχ改为Sχ,以资区别。
(6.2)
将第1号样本的标准差及例数代入式6.2,得
再若将第2号样本的数字代入,Sχ将成为10.74,余类推。由于不同样本的标准差并不相等,可见Sχ也有抽样波动,这一点是值得注意的,但它仍不失为σχ的较好估计值。
以上介绍了求标准误的三种方法,其实我们平常用的只是式6.2,而通过前两种方法的对比则可使我们明瞭标准误的含义。标准误是描述样本均数变异情况的一个指标,它的大小与总体标准差σ(一般只能用S估计)成正比,而与样本含量n的平方根成反比,因此若标准差小或样本含量大时,求出的标准误就小(标准误小表示样本均数与总体均数较接近),X代表μ较可靠,所以假若手头资料中观察值的变异程度较大(S大)时,为了保
证样本代表总体比较可靠,就得适当增大样本含量(n)。
(二)率的标准误 若总体包括某事件的发生数与未发生数两类,所化成的比例或成数即为总体发生率(符号π)与未发生率(1-π)。从总体中随机抽取许多样本(n相等),算出各个样本率(用P表示),会是或大或小有波动的。为了表示样本率之间或样本率与总体率之间的差异程度,当总体率π已知时,可计算理论的标误σp,其公式是
(6.3)
实际工作中往往不知道总体率π这时只能以样本率P作为总体率π的估计值,求得率的标准误,并用SP表示,计算公式为
(6.4)
现举例说明其求法。
例6.1 某医生检测了110名成年健康人的尿紫质,发现阳性者11人,阴性者99人,于是算得阳性率P及率的标准误SP如下:
P=11/110×100%=10% (用小数表示为0.10)
若要进一步增强样本率估计总体率的可靠性,可加大样本含量。
三、样本均数的分布
从同一总体里随机抽取n相同的许多样本,这些样本均数吴正态分布。如前面所述正常人红细胞数的抽样实验中已求得100个样本均数,其中多数与总体均数μ比较接近而集中分布在其周围,且左右基本对称,见表6.3(此表由表6.4中的100个均数划记归组而得)。
表6.3 红细胞抽样实验中100个样本均数的分布
组 段 |
460- |
470- |
480- |
490- |
500- |
510- |
520- |
530- |
540- |
合计 |
样本数 |
1 |
3 |
18 |
28 |
28 |
13 |
7 |
1 |
1 |
100 |
表6.4 一百个样本的均数、标准差、95%可信区间
样本号 |
均数 |
标准差 |
95%可信区间 |
样本号 |
均数 |
标准差 |
95%可信区间 |
1 |
488.6 |
61.65 |
444.49~532.71 |
2 |
498.3 |
33.97 |
474.01~522.59 |
3 |
509.4 |
50.96 |
472.96~545.84 |
4 |
498.4 |
52.63 |
460.76~536.04 |
5 |
494.9 |
29.51 |
473.80~516.00 |
6 |
°546.7 |
43.23 |
515.78~577.62* |
7 |
524.5 |
33.60 |
500.45~548.55* |
8 |
488.3 |
41.04 |
458.94~517.66 |
9 |
485.3 |
55.14 |
445.85~524.75 |
10 |
502.6 |
48.55 |
467.88~537.32 |
11 |
495.1 |
40.63 |
466.03~524.17 |
12 |
524.7 |
37.81 |
497.65~551.75 |
13 |
512.7 |
53.18 |
474.65~550.75 |
14 |
494.8 |
37.24 |
468.15~521.45 |
15 |
493.6 |
39.94 |
465.03~522.17 |
16 |
495.3 |
29.47 |
474.22~516.38 |
17 |
491.0 |
19.32 |
477.18~504.82 |
18 |
506.5 |
53.83 |
468.00~545.00 |
19 |
487.5 |
39.39 |
461.32~517.68 |
20 |
495.9 |
32.70 |
472.51~519.29 |
21 |
504.8 |
34.76 |
479.94~529.66 |
22 |
512.2 |
44.76 |
483.17~547.23 |
23 |
496.5 |
40.65 |
467.41~525.59 |
24 |
499.8 |
37.04 |
473.31~526.29 |
25 |
505.7 |
37.21 |
479.08~532.32 |
26 |
487.7 |
34.50 |
463.02~512.38 |
27 |
501.5 |
37.35 |
474.79~528.21 |
28 |
476.1 |
29.64 |
454.91~497.29* |
29 |
523.2 |
51.57 |
486.31~560.09 |
30 |
509.5 |
33.61 |
485.45~533.55 |
31 |
494.2 |
28.60 |
473.75~514.65 |
32 |
506.2 |
25.29 |
483.10~524.30 |
33 |
501.1 |
27.88 |
481.15~521.05 |
34 |
520.6 |
30.23 |
498.98~542.22 |
35 |
492.0 |
42.18 |
461.82~522.18 |
36 |
509.6 |
19.17 |
495.89~523.31 |
37 |
488.6 |
42.29 |
458.36~518.84 |
38 |
510.9 |
47.55 |
476.88~544.92 |
39 |
516.4 |
39.96 |
487.81~544.99 |
40 |
518.8 |
46.43 |
485.59~552.01 |
41 |
495.9 |
36.89 |
469.53~522.27 |
42 |
°526.4 |
42.78 |
495.80~557.00 |
43 |
505.8 |
53.84 |
467.30~544.30 |
44 |
503.0 |
47.33 |
469.14~536.86 |
45 |
504.8 |
47.77 |
470.62~538.98 |
46 |
492.4 |
29.20 |
471.52~513.28 |
47 |
505.5 |
38.32 |
478.08~532.92 |
48 |
486.5 |
52.98 |
448.59~524.41 |
49 |
515.2 |
38.69 |
487.51~542.89 |
50 |
487.0 |
53.75 |
448.55~525.45 |
51 |
503.3 |
51.54 |
466.43~540.17 |
52 |
491.0 |
58.47 |
449.18~532.82 |
53 |
522.3 |
65.01 |
475.79~568.81 |
54 |
490.3 |
49.92 |
454.58~526.02 |
55 |
516.7 |
37.26 |
490.05~543.35 |
56 |
489.6 |
31.41 |
467.14~512.06 |
57 |
490.0 |
62.90 |
445.01~534.99 |
58 |
489.2 |
30.91 |
467.09~511.31 |
59 |
509.1 |
40.51 |
480.12~538.08 |
60 |
513.5 |
29.18 |
492.62~534.38 |
61 |
476.4 |
42.06 |
446.32~506.48 |
62 |
511.5 |
28.46 |
491.14~531.86 |
63 |
480.7 |
44.83 |
448.62~512.78 |
64 |
501.4 |
29.00 |
480.66~522.14 |
65 |
481.1 |
50.65 |
444.86~517.34 |
66 |
496.0 |
36.53 |
469.87~522.13 |
67 |
489.2 |
44.20 |
457.58~520.82 |
68 |
494.8 |
29.73 |
473.54~516.06 |
69 |
497.2 |
68.49 |
448.21~546.19 |
70 |
504.1 |
35.13 |
478.95~529.25 |
71 |
507.9 |
34.35 |
483.33~532.47 |
72 |
°465.3 |
25.56 |
447.02~483.58* |
73 |
502.6 |
45.54 |
470.03~535.17 |
74 |
486.4 |
48.51 |
451.70~521.10 |
75 |
°526.6 |
32.68 |
503.10~550.10* |
76 |
503.2 |
47.18 |
469.45~536.95 |
77 |
496.7 |
33.45 |
472.77~520.63 |
78 |
504.8 |
43.52 |
473.67~535.93 |
79 |
490.2 |
58.07 |
448.67~531.73 |
80 |
486.6 |
26.60 |
467.57~505.63 |
81 |
506.1 |
28.48 |
485.72~526.48 |
82 |
513.7 |
29.28 |
492.75~534.65 |
83 |
481.5 |
29.78 |
460.19~502.81 |
84 |
491.2 |
44.73 |
459.22~523.18 |
85 |
515.7 |
25.78 |
497.26~534.14 |
86 |
513.9 |
64.62 |
467.69~560.11 |
87 |
496.4 |
23.82 |
479.37~513.43 |
88 |
507.4 |
45.14 |
475.10~539.70 |
89 |
479.1 |
44.15 |
465.52~528.68 |
90 |
498.9 |
30.16 |
477.32~520.48 |
91 |
503.7 |
53.90 |
465.16~542.24 |
92 |
495.9 |
30.86 |
473.78~518.02 |
93 |
494.6 |
58.48 |
452.78~536.42 |
94 |
507.1 |
42.44 |
476.74~537.46 |
95 |
488.5 |
36.15 |
462.65~514.35 |
96 |
489.1 |
68.01 |
440.44~537.76 |
97 |
°530.1 |
58.72 |
488.09~572.11 |
98 |
518.7 |
45.10 |
486.44~550.96 |
99 |
507.8 |
41.87 |
477.85~537.73 |
100 |
540.6 |
55.17 |
465.13~544.07 |
已知按正态分布,理论上有95%的变量值分布在均数加、减1.96倍标准差(样本均数的标准差称标准误)的范围内,这里也即100个样本均数中有95个分布在500-1.96(13.60)=473.34至500+1.96(13.60)=526.66的范围内。现看表6.4,在100个样本均数中,第6号(546.7)、第72号(465.3)、第97号(530.1)在上述范围之外,第42号(526.4)及第75号(526.6)就在临界值附近,其余95个(若将第42及75号计算在内则为97个)样本均数在此范围之内,将实际分布与理论分布相对照见下表6.5。100个样本均数的实际分布与正态分布的理论基本符合。