灰色系统残差GM(1,1)模型应用于前列腺癌流行趋势预测
数理医药学杂志 2000年第5期第13卷
作者:段琼虹 聂绍发 仇成轩 施侣元
单位:段琼虹(同济医科大学流行病学教研室 武汉430030);聂绍发(同济医科大学流行病学教研室 武汉430030);仇成轩(山东济宁医学院);施侣元(同济医科大学流行病学教研室 武汉430030)
关键词:疾病预测;灰色系统残差;CM(1;1)模型;前列腺癌;流行病学;死亡率
摘 要: 根据武汉市城区居民1990~1997年前列腺癌死亡资料建立灰色系统残差GM(1,1)模型,预测1998~2000年该市居民前列腺癌流行趋势,旨在评价灰色系统残差GM(1,1)的效果,并为前列腺癌的人群防治提供依据。拟和结果显示,模型的平均误差率为6.88%,精度为优(C=0.32,P=1)。预测结果表明,武汉市城区居民(男性)此间前列腺癌死亡率呈缓慢增加趋势。
中图分类号: R 737.25 文献标识码: A 文章编号:1004-4337(2000)05-0385-02
准确的疾病预测可为制定疾病防治对策提供依据,因而对疾病的人群防治有重要的指导价值。本文在武汉市居民前列腺癌流行病学研究基础上,应用灰色系统残差GM(1,1)模型预测该市居民1998~2000年前列腺癌流行趋势,旨在评价灰色系统残差GM(1,1)的效果,并为人群防治工作提供依据。
1 材料与方法
1.1 资料来源
通过武汉市卫生防疫机构居民死亡报告登记收集武汉市居民(男性)前列腺癌的死亡资料,人口资料以1990年全国第四次人口普查资料中的武汉市人口资料为基础[1],并根据武汉市市区人口变动资料[2],推算武汉市城区1991~1997年各年度总人口数。
1.2 预测内容和方法
根据武汉市城区居民1990~1997年前列腺癌死亡资料,通过建立残差GM(1,1)模型,预测1998~2000年该市居民前列腺癌死亡率水平。
1.3 灰色系统残差GM(1,1)模型建立方法
根据文献[3]提供的计算公式,采用Borland C++语言编写计算程序。参数计算和预测过程均在IBM PC/586 计算机上完成。
建立灰色系统残差GM(1,1)模型的基本步骤如下:
① 计算累加生成数列
设由n个原始数据组成的原始数列为x(0)(k)={x(0)(1),x(0)(2),…,x(0)(n)},其累加生成数列为:
② 计算均值生成数列
z(1)(k)=1/2(x(1)(k)+x(1)(k-1))
③ 建立GM(1,1)模型
式中,为累加生成预测值;a、u为待求参数。可按下述方法计算:
首先,确定数据矩阵B、Yn:
再按下式计算对应原始数据的理论预测值:
④ 建立残差GM(1,1)模型
求出残差,按残差q(0)(k)建立GM(1,1)模型如下:
得出残差GM(1,1)模型如下:
式中,为未参加建立模型的残差个数。
1.4 预测效果评价(精度检验)
回代误差(残差,e)及后验差检验通过实验观察值与理论预测值比较,计算回代误差绝对值、平均误差率;同时,通过后验差比值C和小概率误差p评价模型预测效果及精度。
平均误差率=平均误差绝对值/实际值的均值
后验差检验方法:C=S2/S1。式中,S1和S2分别为实际值的标准差和回代残差的标准差。判别标准:C<0.35且p>0.95,模型判为优;C<0.45且p>0.80,模型判为良;C>0.50且p>0.70,模型判为中;C≥0.65且p≤0.70,模型判为差。
2 结果
2.1 灰色系统残差CM(1,1)预测模型
根据死亡率资料分别建立相应的灰色系统残差GM(1,1)模型:
2.2 预测结果及精度检验结果
武汉市城区居民1998~2000年前列腺癌死亡率预测结果见表1,回代结果见表2。后验差结果显示,死亡率预测模型C=0.32,p=1.00,模型判为优。
表1 武汉市城区居民1998~2000年前列腺癌
死亡率预测结果
预测年份 |
死亡率预测值(1/10万) |
1998 |
1.376036 |
1999 |
1.455893 |
2000 |
1.541504 |
表2 武汉市城区居民1990~1997年前列腺癌死亡率回代
年份 |
死亡率(1/10万)(GM(1,1)模型) |
死亡率(1/10万)(残差GM(1,1)模型) |
实际值 |
理论值 |
误差绝对值(%) |
实际值 |
理论值 |
误差绝对值(%) |
1990 |
0.511792 |
- |
- |
0.511792 |
- |
- |
1991 |
0.762199 |
0.911615 |
0.149416(19.60) |
0.762199 |
0.911615 |
0.149416(19.60) |
1992 |
1.010030 |
0.966241 |
0.043789(4.34) |
1.010030 |
0.966241 |
0.043789(4.34) |
1993 |
1.101476 |
1.024141 |
0.077335(7.02) |
1.101476 |
1.085435 |
0.016041(1.45) |
1994 |
1.093814 |
1.085509 |
0.008305(0.76) |
1.093814 |
1.124029 |
0.030215(2.76) |
1995 |
1.283703 |
1.150555 |
0.133148(10.37) |
1.283703 |
1.174763 |
0.108940(8.48) |
1996 |
1.176724 |
1.219499 |
0.042775(3.64) |
1.176724 |
1.234713 |
0.057989(4.93) |
1997 |
1.217232 |
1.292574 |
0.075342(6.19) |
1.217232 |
1.302135 |
0.084903(6.97) |
表3 GM(1,1)模型与残差GM(1,1)模型效果比较
|
GM(1,1)模型 |
残差GM(1,1)模型 |
平均误差率 |
7.42% |
6.88% |
模型精度(C,p) |
中(C=0.37,p=1) |
优(C=0.32,p=1) |
|
3 讨论
3.1 关于灰色系统残差GM(1,1)模型
灰色系统理论(Grey System Theory)是由中国学者邓聚龙教授于80年代初创立。该理论最早被应用于农业、工业、气象等方面,后被应用于医学领域,尤其是广泛应用于疾病(传染病、寄生虫病,特别是恶性肿瘤等)的预测[4]。灰色动态系统是灰色系统理论的核心,常用于时间序列的预测。GM(1,1)模型是灰色动态模型中最基本、应用最广泛的预测模型。与传统的数理统计模型相比,该模型在疾病预测方面具有明显优点:① 无需典型的概率分布;② 减少时间序列的随机性;③ 小样本即可计算;④ 计算简便。但是,当数据序列的波动幅度较大时,GM(1,1)模型的精度很难提高。本文时间序列数据若用单纯的GM(1,1)模型,则精度不高(平均误差率为7.42%,后验差检验显示:模型精度为中)。但经过残差修正后,得到的残差GM(1,1)模型的精度有所提高(平均误差率为6.88%,后验差检验显示:模型精度为优)。可见,该模型的预测性能较好。
3.2 武汉市居民前列腺癌1998~2000年流行趋势
前列腺癌是欧美国家中老年男性最常见的恶性肿瘤之一[5],九十年代以前,欧美等前列腺癌高发国家其前列腺癌死亡率一直呈持续增长的趋势,随着前列腺癌早期诊断、临床有效治疗和早期预防等方面的研究不断取得进展,这种趋势逐渐减弱,并从九十年代初以来,许多国家和地区前列腺癌的死亡率开始出现缓慢下降的趋势[6,7],预期在未来几年内这种趋势还将继续下去。有关对前列腺癌低发国家未来前列腺癌的流行趋势的研究尚未见报告。根据本研究资料,认为在今后几年内,武汉市居民前列腺癌的死亡率呈缓慢上升趋势。
卫生部科研基金资助项目
参 考 文 献
1,武汉市人口普查办公室.湖北省武汉市1990年人口普查资料(计算机汇总).1992,84~85.
2,武汉市统计局编.武汉市统计年鉴—1997(内部资料).1998,52~53.
3,邓聚龙著.灰色系统预测与决策.武汉:华中理工大学出版社,1990,133~142.
4,汪爱勤,鱼敏.灰色预测方法在疾病预测中的应用.中华流行病学杂志,1988,9(1):49~52.
5,Landis SH, Murryay T, Bolden S, et al. Cancer Statistics, 1998,CA Cancer J Clin 1998,48(1):6~29.
6,Stat Bite. Changes of cancer incidence in the United States, 1973~1990 and 1990~1995. J Natl Cancer Inst 1998,90(6):419.
7,Shibata A, Ma J, Whittemore AS, et al. Prostate cancer cancer incidence and mortality rate in the United States and United Kingdom. J Natl Cancer Inst 1998,90(16):1230~1231.
收稿日期:2000-01-16