第十七章 统计表和统计图
统计表和统计图都是将已整理的资料用简明的表格或图形表达出来,使人获得明晰而直观的印象,避免冗长的文字叙述,便于比较分析。
一、统计表
统计表(statistical table)是从整理表中选出需要的资料,经过统计加工为各种指标后,列成便于对比分析的表格。
(一)统计表的结构和要求
表的结构要简洁,最好一事一表,避免臃肿庞杂。
例17-1 吴氏等研究某些疾病发生高催乳素血症的频率,结果归纳如表17-1。
表17-1 高催乳素血症的发生率
诊断 |
总例数 |
高催乳素血症例数 |
发生率(%) |
嫌色细胞瘤 |
80 |
62 |
77.5 |
肢端肥大症 |
41 |
17 |
41.5 |
蝶鞍部其他肿瘤 |
29 |
10 |
34.5 |
原因不明闭经 |
67 |
14 |
20.9 |
月经量少 |
20 |
3 |
15.0 |
单纯泌乳 |
5 |
0 |
… |
精神分裂症 |
1 |
1 |
… |
资料来源:吴建中等 中华妇产科杂志20:34,1985年
以该表作为典范,说明统计表的结构特点:
1.标题 简练,用词确切,能表达中心内容,左侧有表号以备查考(必要时还应标明资料来源和时间)
2.标目 有横标和纵标目,横标目又称主辞,是研究事物的,通常位于表内左侧;纵标目的是研究事物的,又称宾辞,列在表内上方,其表达结果与主辞呼应,读起来就是一完整句子。例如第一行可读成:“嫌色细胞瘤80例,有62例出现高催乳素血症,发生率77.5%。”
3.线条 力求简洁,该表除有较粗的顶线和底线外,表内只有一条隔开纵标目的的细横线,简单明了。
4.数字 位置上下对齐、准确、率的小数点后所取位数也上下一致。该表最后两个率因为构成的绝对数太小,作者在发生率栏中用“…”来表示,这是对的。一般如果某格无数据或暂缺资料,也可用“-”或“…”来表示。
5.内容排列 一般按事物发生频率大小顺序来排列,对比鲜明,重点突出。
(二)统计表的种类
常用的有四种:
1.简单表 常用以比较互相独立的统计指标,主辞未经任何分组。表17-1即属简单表。
2.分组表 主辞按一个标志分组,结构形式与简单表基本相似。通常设有合计栏,以利说明综合水平。
例17-2 1984年上海县随机抽查30岁以下的正常人群的麻诊免疫水平,共检查733人结果统计如表17-2。
表17-2 1984年上海县部分健康人群麻疹抗体
年龄(岁) |
检测人数 |
阳性人数 |
阳性率(%) |
平均滴度之例数 |
0~ |
124 |
123 |
99.2 |
43.52 |
5~ |
141 |
141 |
100.0 |
37.64 |
10~ |
147 |
147 |
100.0 |
21.43 |
15~ |
109 |
102 |
93.6 |
15.50 |
20~ |
91 |
89 |
97.8 |
17.94 |
25~ |
121 |
119 |
98.3 |
19.78 |
合计 |
733 |
721 |
98.4 |
25.14 |
资料来源:郑平等 上海医科大学学的增刊53页,1987年
表17-2的主辞是按年龄分组的调查对象,亦就是按年龄一个标志分组,所以属于分组表。
3.复合表 主辞按两个以上标志分组。在安排上可将部分主辞放在表的上方,与宾辞配合起来。
例17-3 胡氏介绍改良阴道纵隔手术治疗子宫脱垂132例,疗效统计表如表17-3。
表17-3 132例子宫脱垂手术前后症状比较
症状 |
手术前 |
手术后 |
例数 |
% |
例数 |
% |
下坠感 |
126 |
95.45 |
13 |
9.85 |
性生活不满意 |
123 |
93.18 |
3 |
2.27 |
腰酸痛 |
47 |
35.60 |
9 |
6.82 |
排尿困难 |
36 |
27.27 |
0 |
0 |
压力性尿失禁 |
17 |
12.88 |
0 |
0 |
资料来源:胡丽华 中华妇产科杂志20:56,1985年
复合表是否需要合计应从有无意义来决定
4.列联表 把数据资料列成交叉分类的表格,使一种属性的亚类以水平方向(行)表示,另一种属性亚类以垂直方向(列)表示。这样行变量与列奕量之间的联系便显示出来,并加以检验。最简单的列联表是四格表(2×2表);还有多维分类形式的列联表。
例17-4 罗氏等应用国产放射免疫检测试剂“北方RIA”与进口试剂“AUSRIA”对肝癌发高发区居民乙型肝炎表面抗原(HBsAg)进行配对检测,结果统计如表17-4。
该表资料可以应用配对x2检验法作进一步分析,具体方法将于第二十章介绍。
表17-4 两种试剂检测HbsAg结果比较
北方RIA |
进口AUSRIA |
合计 |
+ |
- |
+ |
244 |
107 |
351 |
- |
149 |
1146 |
1295 |
合计 |
393 |
1253 |
1646 |
资料来源:罗斯等 肿瘤论文汇编125页,1987年广西壮族自治区
二、统计图
统计图(statistical diagram)一般是根据统计表的资料,用点、线、面或立体图像鲜明地表达其数量或变化动态。医学统计常用的有线图、直方图、长条图、圆形图和统计地图等。
(一)制图通则
1.根据资料性质和分析目的正确选用图形。
2.要有确切的标题和编号,其位置通常安排在图体下面。
3.在同一图内比较几种不同的事物时,须用不同的线条或颜色表示,并附图例说明。图例位置要与图体协调、美观;如有碍于形象,则不要放在图体内。
4.有纵轴和横轴为坐标的图形,一般都以第一象限为准则作图,以两轴交点为起点,纵、横轴都应有标目,并注明尺度的数量单位。
(二)医学常用统计图及绘制法
1.线图(line diagram)
(1)适用于连续变量资料。说明某事物因时间、条件推移而变迁的趋势。
(2)横轴常用以表示某事物的连续变量,纵轴多表示率、频率或均数。
(3)纵轴采用算术尺度,从零开始。如果图形的最低点与零点差距很大,则可在纵轴基部作折断口,使线段降低以求美观。横轴可以不从零开始,如果以组段为单位,则每组均以组段下限为起点。但绘图的坐标点则应以组段中点为宜。
(4)同一图内不宜有太多曲线,以免混淆不清。如有几条线作对比,则用不同线形来区别,并有图例说明。
例17-5 根据成都学龄前儿童生长发育的3年追踪调查,身高的年增长值按性别分组统计比较如表17-5和图17-1。因为身高发育是连续性变量资料,用曲线图来表示是适宜的。该图很微妙地反映出儿童少年生长发育期的规律:女孩身高从8岁起增长很快,10岁左右达到突增高峰。男孩则在10岁起才迅速增长,13岁左右达突增高峰。这和生理上女孩青春期了育比男防早一些,是十分吻合的。
表17-5 1979~1982年成都学龄前儿童身高年增长值(cm)
(岁) |
男 |
女 |
人数 |
均数 |
标准误 |
人数 |
均数 |
标准误 |
7~ |
72 |
5.90 |
0.93 |
108 |
6.07 |
0.94 |
8~ |
198 |
5.88 |
1.01 |
213 |
5.42 |
1.58 |
9~ |
322 |
5.17 |
1.13 |
234 |
6.18 |
1.84 |
10~ |
351 |
5.26 |
1.53 |
338 |
6.78 |
1.72 |
11~ |
356 |
6.49 |
2.30 |
370 |
6.59 |
1.72 |
12~ |
322 |
7.72 |
2.45 |
316 |
5.13 |
1.96 |
13~ |
296 |
7.93 |
2.38 |
293 |
3.75 |
2.16 |
14~ |
266 |
4.55 |
2.61 |
200 |
1.46 |
1.27 |
15~ |
173 |
3.16 |
2.12 |
121 |
1.24 |
1.10 |
资料来源:张兴儒等 中华预防医学杂志21(6):338,1987年
图17-1 成都市男女学生平均身高年增长值曲线
另外不有一种线图叫半对数线图(semilogline diagram),纵轴用对数尺度,横轴仍用算术尺度。这种图常用于比较两组相对数的比值相差较大的动态数列。原因是同样的增长速度在对数尺度上的距离是相等的。例如表17-6中的三组数据,由时间A到B分别绘在算术格纸(图17-2a)和半对数格纸(17-2b)上,呈现两种不同的结果。a图三条直线坡度相差悬殊,这是三组数据的绝对差相差悬殊之故;b图则因三组数据的对数差相等,下降坡度亦一样。
图17-2 三组数据绘在算术(a)和半对数(b)格纸上的线图比较
表17-6 绝对差与对数差的比较
A→B |
绝对差(A-B) |
相对比(A/B) |
对数差(IgA - IgB) |
1000→100 |
900 |
10 |
Lg1000-lg100=3-2=1 |
100→10 |
90 |
10 |
Lg100-lg10=2-1=1 |
10→1 |
9 |
10 |
Lg10-lg1=1-0=1 |
下例进一步说明半对数线图应用的实际意义。
例17-6 美国疾病控制中心(CDC)报道,自从应用白喉类毒素作为儿童常规免疫接种后,白喉发病率和死亡率明显下降,但病死率仍停留在一定水平上。三者动态变化表达如图17-3。
图17-3 应用类毒素免疫接种后的白喉发病率、死亡率和病
死率的动态变化比较(1920~1975年)
(资料来源:CDCNo.12,1978,Atlanta,Ca,USA)
该图很形象地表明在55年内白喉发病率和死亡率下降速度基本一致。但两组数据的前后绝对差却很悬殊,如果用算术格纸来描绘,直观上将产生发病率下降坡度明显大于死亡率下降的错觉。图中还反映了白喉病死率自1920~1970年间变化不明显,与白喉死亡率不同;这里存在两个率的含义不同的原故,本教材的第二十四章将予阐明。
2.直方图(histogram)
(1)直方图是以面积表示数量,适用于表达连续性资料的频数或频率分布。
(2)横轴表示变量,尺度可以不从零开始。同一轴上的尺度必须相等。
(3)作图时各直条的宽度应等于组距,高度应等于该组的频数或频率。组距相等的分组资料才能作图,否则应先换算成相等组距。以下是120例T3比值频数表作图(图17-4)。
图17-4120例正常血浆结合
125I-Ts树脂摄取比值分布
将各组直方的顶端中点相连,即成多边图,也可用来表示连续性资料的频数颁布情况。
3.直条图(bar chart)
(1)直条图是用等宽直条的和长短来表示各统计量的大小,适用于彼此独立的资料互相比较,有单式和复式两种。
(2)作图时,一般是以横轴为直条图的基线,纵轴表示频数或频度,从零开始;直条间的距离一般以条宽的1/2为宜。排列顺序若非自然顺序资料,则按由高到低的次序排列,便于比较。
(3)复式直条图的制图要求与单式相同,但每组的直条最好不要过多,同组直条间不留空隙,组内各直条排列次序要前后一致。
例17-7 上海县统计了1960~1962年和1978~1980年两段时期的居民前10位死亡原因。现将其中可配比的9对资料绘成直条图(图17-5)比较如下。
图17-5 上海县居民在1960~1962年与1978~1980年间
死亡原因变化的比较
资料来源:GuXingyuan et al ,AJPH72(Sup.)p.22,1982
该图给人的鲜明印象是原居首位的传染病死亡率与第6位的恶性肿瘤死亡率互易位;同时脑血管病和心脏病分别进到第2位和第3位。
4.百分条图(percentchart)
用以表达构成比的图形,绘制简便,而且可将多条并列作比较,以阐明疾病的动态变化。
例17-8 某矿采用湿式作业,粉尘浓度明显下降。若干年后,新发矽肺减少,历年存活矽肺患者的期别也随之发生变化。作者根据表17-7统计资料绘制百分条图比较如图17-6。
5.圆形图(circulargraph)
用途同百分条图,是以圆的半径将圆面分割成多个大小不等扇形来表达构成比。作图法是先将各个百分比乘以3.60,获得圆心角度数,按其大小排列从0时开始,且量角器顺时针方向划分为一系列扇形。图17-7是某厂某年工伤分析百分比图。
表17-7 某矿1961~1965年矽肺患者期别构成比
矽肺分期 |
1961年 |
1962年 |
1963年 |
1964年 |
1965年 |
例数 |
% |
例数 |
% |
例数 |
% |
例数 |
% |
例数 |
% |
Ⅰ |
48 |
50.5 |
54 |
47.8 |
61 |
43.9 |
64 |
41.3 |
67 |
39.9 |
Ⅱ |
33 |
34.7 |
41 |
36.3 |
53 |
38.1 |
60 |
38.7 |
66 |
39.3 |
Ⅲ |
14 |
14.8 |
18 |
15.9 |
25 |
18.0 |
31 |
20.0 |
35 |
20.8 |
合计 |
95 |
100.0 |
113 |
100.0 |
139 |
100.0 |
155 |
100.0 |
168 |
100.0 |
图17-6 某矿1961~1965年各期存活矽肺构成比的动态
图17-7 某年某厂工伤病例百分比
6.点图(scatterdiagram)
表示两种事物变量的相关性和趋势。医学上常用于观察两种生理指标之间的动态变化关系,或临床上两项检测结果之间的量变关系。点图绘测方法是先绘出适学的坐标,一般以两轴正交点为0点,但也可按两变量的全距中最小值起点加以高速调整。x变量定在横轴,y变量定在纵轴;然后将每受检者测得两变量值,找出P(x,y)所在的方位,并绘出各自的坐标点。最后根据点的颁布情况进行分析。
例17-9 某中学测得最高年级100名男生身高、体重的结果,绘成点图如图17-8。
7.疾病状况动态结构图
是有目的地观察几种主要病伤类别构成的动态,从而评价卫生工作效果,指导以后工作的规划和策略。图17-9是美国1900~1973年间11种主要传染病历年占总死亡率百分比的动态;从1900年占40%到1970年仅6%;相应的中风、肿瘤和心脏病在该期间从20%上升到59%;意外事故死亡所占比重则变化不大。
以上只介绍几种常用统计图、表范例和绘制通则,读者可根据资料内容和需要灵活运用和发展。
图17-8 某年某校100名男生身高体重相关图
图17-9 1900~1973年间美国传染病和慢性疾病死亡率构成动态变化