(一)基本概念
相关性研究(correlationalstudy)又称生态学研究(ecological study)。它是以人群组为基本单位收集和分析资料,从而进行暴露与疾病关系的研究,即用代表人群组特征的量度来描述某些因素与疾病的关系,例如年龄、时间、卫生服务的利用,或者食品、药物及其他产品的消耗等。它描述某疾病或健康状态在各人群中所占的百分数或比数,以及有各项特征者在各人群中所占的百分数或比数。从这两类群体数据分析某疾病或健康状态的分布与人群特征分布的关系,从而探求病因线索。
(二)研究类型
1.生态比较研究(ecological comparison study)这种方法系比较在不同人群中疾病的发病率或死亡率的差别,了解这些人群中某些因素的出现率并同疾病的发病率或死亡率对比看是否一致,从而为探索病因找到线索。
例如,通过生态比较研究发现:①大肠癌在发达国家比发展中国家更常见。这促使人们考虑饮食习惯和环境污染是否与大肠癌发病有关。②大肠癌的发病率和死亡率的性别比接近1。这提示有关的暴露在男性和女性中应是相近的;并再次提示与饮食和环境暴露的联系。③大肠癌的发病率城市高于农村。这提示某些危险因素在城市比农村更为普遍,因此工业活动导致的环境污染应考虑可能为与大肠癌有关的因素。
2.生态趋势研究(ecological trend study)系指连续观察一个或多个人群中平均暴露水平的改变和某疾病的发病率、死亡率的变化的关系。世界卫生组织资助的心血管病趋热监测方案从1984~1993年,包括27个国家、39个中心、113个报告单位和1300万人口。其主要目的是测量心血管病发生和死亡的趋势,并将其与危险因素的变化,卫生保健和社会经济条件联系起来分析。这就是著名的MONICA方案。我国北京心肺血管中心1984年正式参加这个方案。北京市7个地区70万自然人群,通过三级心血管病监测网进行监测。就一个人群来讲,属于单组时间趋势研究;就整个MONICA方案来讲,则属于多组时间趋势研究。根据MONICA协作组和北京心肺血管中心已经报告的部分结果来看,心血管疾病的发生率和死亡率的变化与某些危险因素的变化,例如吸烟率、血压的平均水平、血清胆固醇水平等的变化有显著的相关关系。这不仅再次说明了吸烟、高血压和高胆固醇血症等为心血管病的危险因素;同时明确地提示心血管病是可以预防的,人们可以按计划采取行动,减少心血管病的发生和死亡。
(三)研究步骤
1.确定研究人群 根据具体情况,研究人群可大可小;可以是不同行政区或地理区域的全部人群,也可以是由其中不同年龄、性别、种族、职业、宗教和社会经济地位的人群所组成。确定研究人群时必须考虑到能否收集到有关研究人群疾病的发病率、死亡率及有关暴露的资料。
2.收集资料 以群体为单位收集资料。例如,若以全县为基本观察和分析单位,可以从各县的统计资料中得到有关人口学和社会经济方面的资料。如不同人群的年龄、性别构成,家庭平均收入,成年人受教育情况,人口密度,各民族人口所占的比例,城乡人口的比例,各种职业人口的比例,烟、酒的人均消费情况以及环境情况等资料;从卫生当局可以收集到不同年龄组各种疾病的发病率、死亡率、各种疫苗接种情况,动物传染源和媒介昆虫消长的资料。在作生态趋势研究时,还可以收集有关疾病时间趋势的资料。
3.分析资料 比较不同人群组的特征,进行生态比较研究,观察疾病与有关暴露之间的联系;亦可作生态趋势分析,观察不同人群组的特征的变化及疾病的变化之间的联系。
由于所分析的各人群人数可能有很大不同,因而各人群所提供的信息量也就不同,因此,在作相关和回归分析时,常需进行人数标化(加权分析)。
(四)主要用途
1.通过生态学研究可以提出与疾病的分布有关的病因假设。
2.可用于评价干预实验或现场实验的效果 例如,在某人群中推广低钠盐,然后比较推广低钠盐前后人群平均钠摄入水平的变化与人群平均血压值的变化趋势,以评价低钠盐干预的效果。
3.在疾病监测工作中应用生态趋势研究 以估计某疾病的趋势,有利于预防和控制疾病。
(五)生态学研究的局限性
生态学研究对于调查某些因素与疾病或健康状态之间的关系时,能够快速、经济地完成,并且常可利用现有的资料,如人口学的和各种产品的数据资料,疾病发生和死亡的资料,卫生资源利用情况的资料以及监测规划和疾病登记的资料等。
但是,生态学研究只是粗线条的描述性研究。生态学上某疾病与某因素分布的一致性,可能是该疾病与某因素间真正有联系,但也可能毫无联系。当生态学上的联系与事实并不相符时称为“生态学谬误”(ecologicalfallacy)或“生态偏倚”(ecological bias)。这就是生态学研究的局限性所造成的。主要有下列几种情况:
1.缺乏暴露与疾病联合分布的资料 这是指研究者只知道每个研究人群内的暴露数和非暴露数,患病数和非患病数,但不知道在暴露者中有多少发生了疾病或非暴露者中有多少发生了疾病。也就是说,生态学研究不能在特定的个体中将暴露与疾病联系起来。例如,有人研究了1950~1954和1965~1969年间宫颈癌死亡的减少与每年进行巴氏涂片筛检的妇女的百分比的相关情况。结果发现,筛检妇女百分比越高,宫颈癌死亡下降越大,二者之间有很强的统计学意义的正相关。因而认为,筛检规划可能导致宫颈癌死亡率减少。很显然,只根据该资料不可能决定经过筛检的妇女的死亡危险是否确实下降,因此不能检验该假设。
2.缺乏控制可能的混杂因素的能力 1964~1965年在28个国家里的一项研究表明,平均每人每天摄入猪肉量与乳腺癌死亡率之间有很强的正相关,提示猪肉摄入和乳腺癌死亡之间可能有联系。然而,增加猪肉消耗可能只是与乳腺癌危险增加有关的其他一些因素的一个标记,如增加了脂肪摄入,减少了蔬菜摄入或猪肉摄入多的人有较高的社会经济地位等。利用相关资料不可能将这些潜在的混杂因素的影响分离开。因而,相关的存在并不一定表明真实联系的存在。反过来,相关性研究缺乏相关,也并不一定表明缺乏真实的联系。例如,70年代的早期,美国口服避孕药(OC)的使用增加,而同时育龄妇女中冠心病(CHD)死亡率下降约30%。这些相关资料提示使用OC与致死性CHD间有负的联系。然而,大量分析性研究一致表明,使用OC者比不使用者平均致死性CHD危险增加约1倍。
3.相关资料中的暴露水平只是近似值或平均水平,而不是个体实验的值。因此,有时相关并不能精确地解释暴露的改变量与所致疾病发病率或死亡率的改变量的关系。有时还可能在疾病和暴露之间蒙上了更复杂的联系。例如,有人研究了19个国家酒精消耗与CHD死亡之间的相关。结果为明显的负相关,酒精消耗越多,CHD死亡越低。实际上,分析性研究表明,酒精消耗与CHD死亡之间不是一个简单的负的联系,而是一个“J”形曲线。重度饮酒者CHD死亡危险最大,中等量饮酒者致死性CHD的危险比重度饮酒者和不饮酒者均低。相关性研究很难看出这种非线性关系。
(六)研究实例
我国医务工作者应用相关性研究获得令人信服的结果者不乏其例。
例如,散发性脑炎,因各家对本病看法不一,故命名亦异,曾命名为“散发性病毒性脑炎”、“非特异性脑炎”、“不典型脑炎”、“急性播散性脑脊髓炎”、“弥漫性多灶性脑病”等。1978年全国第二届神经精神病学术会议后多称“散发性脑炎”。
1976~1988年温州医学院第一附属医院神经内科住院的379例“脑炎”病例的发生与温州市咪唑类驱虫药年销售之间有明显的联系。由表3-1和图3-1可见,1976~1982年四咪唑(TMS)的销售量越大,“脑炎”病例数越多。1976年TMS上市不久,年销售量15kg,当年病例数11例;次年销售量增至52.5kg,病例数增至40例;随后几年,两者几乎呈“并行”关系,为典型的正相关(r=0.994,P<0.01)。1982年下半年,卫生部发文淘汰包括TMS在内的127种药品,1983年病例数即由1982年的37例降为11例,1984年仅8例。病例数下降的时间比药品淘汰时间延迟的原因,作者推测可能与基层单位及民间江湖游医仍在应用TMS有关。1985年“脑炎”病例数有所回升,则可能与左旋咪唑(LMS)上市及大量应用有关。LMS与TMS的化学结构、药理作用相似,用法用量相同,基于上述分析得出结论,TMS在温州市的应用与淘汰是造成该市“脑炎”发病数骤升与骤降的直接原因。1983年和1984年“脑炎”病例数减少是TMS被淘汰带来的干预作用。LMS取代TMS上市,又使“脑炎”发病数回升。因此,咪唑类药物的应用与散发性脑炎的发病存在因果关系的可能性很大(药物流行病学杂志.郑荣远等.1993)
表3-1 温州市咪唑类驱虫药年销售量*及“脑炎”病例数(1976~1988年)
年 份 | |||||||||||||
1976 | 1977 | 1978 | 1979 | 1980 | 1981 | 1982 | 1983 | 1984 | 1985 | 1986 | 1987 | 1988 | |
TMS(kg) | 15.0 | 52.5 | 52.5 | 69.5 | 42.5 | 55.5 | 2.5 | 0 | 0 | 0 | 0 | 0 | 0 |
LMS(kg) | 0 | 0 | 0 | 0 | 0 | 0 | 2.5 | 40.5 | 87.5 | 107.5 | 107.5 | 105.0 | 80.0 |
例 数 | 11 | 40 | 38 | 52 | 37 | 50 | 37 | 11 | 8 | 17 | 26 | 23 | 29 |
*重量均按基质计算。郑荣远等,1993
图3-1 温州市咪唑类驱虫药年销售量与“脑炎”病例数的关系(1976.1~1988.12)