日本血吸虫卵在BLAB/C鼠脾脏异位损害
疾病控制杂志 1999年第3期第3卷 论著摘要.经验交流
作者:王 维 汪学龙
单位:安徽医科大学寄生虫学教研室, 安徽 合肥 230032
关键词: 日本血吸虫卵;BALB/C鼠
【文献标识码】 A
【中图分类号】 R195.1; O212
【文章编号】 1008-6013(1999)03-0224-02
Curve linearization and nonlinear regression
LOU Dong-hua
在医学研究的实际问题中,两个变量之间的回归关系大多是非线性的,这时选择恰当类型的曲线比拟合直线更符合实际情况。如:细菌培养中每一时刻的细菌总数y对时间x呈指数曲线,某病发病率y与时间x呈logistic曲线等。此时可以对因变量y和自变量x拟合一曲线,曲线拟合方法可分为两类:一类是传统的曲线直线化方法,是目前国内用的最多的一种方法,这种方法的显著特点是计算简便,模型参数检验有效;另一类方法是非线性回归法。
1 方法比较
1.1 曲线直线化 曲线直线化法,即利用变量变换的方法,使变换后的两个变量之间呈直线关系。求出直线回归方程后,再将方程中的变量通过逆变换还原,求得所求的曲线回归方程。例如某防治站重复治疗钩虫病人的次数x与复查阳性率(%)y呈指数曲线=eα+βx,作变换lny=z得=α+βx,利用最小二乘法使L=(z-)·(z-)=min,求出α、β的最小二乘估计b=1xz/1xx,a=-b,得到关于z、x的直线回归方程=a+bx。再利用逆变换y=ez得到=ea+bx。
此法计算简便,但是最小二乘法最小值是变换后的z,换句话说,此时求出的最小二乘估计并不能保证使(y-)·(y-)达到最小。
1.2 非线性回归 非线性回归模型y=F(β0,β1,…,βr,x1,…,xn)+ε=F(β)+ε通过极小化L(β)=(y-F(β))·(y-F(β)),求出β的估计,但似然方程:没有显式解,所以采用选代法求解。
2 实例分析
以文献中的某县1980~1996年月累计麻疹发病率(1/10万)的曲线拟合为例,原始数据1~12月累计(x)的发病率(y)依次为:0.279、0.920、2.078、4.393、8.144、12.174、17.306、18.435、18.728、18.965、19.230、19.328。图1是原始数据的散点图,散点呈“s”形,适宜拟合logistic曲线。
方法一:(曲线直线化)
作logistic变换z=ln〔K/(y-L)-1〕,其中L是下渐近线的坐标,K是上、下两渐近线的距离,从散点图中直观看出L最小值为0,K=19.36,对z、x作线性回归,求出回归方程z=4.913401-0.928010x再经变量转换得:
=19.36/〔1+exp(4.913401-0.928010x)〕
=19.36/〔1+136.10151exp(-0.928010x)〕
各样本回归值与残差r如表1所示:
拟合优度R2=1-sse/sst=0.99680
图1 月累计麻疹发病率散点图
方法二:作非线性回归=19.36/(1+a·exp(bx)),用牛顿迭代法求出参数估计
a=200.00 b=-1.00即回归方程=19.36/(1+200.00exp(-1.00 x)),各样本回归值与残差r如表1。拟合优度R2=0.99736。
表1 两种方法的回归值与残差r
样 本 |
曲线直线化 |
非线性回归 |
x |
y |
|
r |
|
r |
1 |
0.279 |
0.35324 |
-0.07424 |
0.25960 |
0.01940 |
2 |
0.920 |
0.86926 |
0.05074 |
0.68978 |
0.23022 |
3 |
2.078 |
2.05748 |
0.02052 |
1.76684 |
0.31116 |
4 |
4.393 |
4.47667 |
-0.08367 |
4.15172 |
0.24128 |
5 |
8.144 |
8.36516 |
-0.22116 |
8.24676 |
-0.10276 |
6 |
12.174 |
12.74003 |
-0.56603 |
12.94334 |
-0.76934 |
7 |
17.306 |
16.06071 |
1.24529 |
16.37380 |
0.93550 |
8 |
18.435 |
17.90581 |
0.52919 |
18.14276 |
0.29224 |
9 |
18.728 |
18.75775 |
-0.02975 |
18.89367 |
-0.16567 |
10 |
18.965 |
19.11734 |
-0.15234 |
19.18579 |
-0.22079 |
11 |
19.230 |
19.26334 |
-0.03334 |
19.29555 |
-0.06555 |
12 |
19.328 |
19.32167 |
0.00633 |
19.33624 |
-0.00824 |
3 讨论 曲线直线化法和非线性回归都可以拟合曲线,但二者的出发点不一样,拟合的曲线方程也略有差异,拟合的效果从拟合优度R2来看,非线性回归优于曲线直线化。但是我们并不能保证非线性回归的参数估计的迭代能收敛,参数初始值的选取对迭代结果也有影响。实例中要拟合logistic曲线,首先得确定L和K的值,L与K的值在曲线直线化中只能凭直观得出,L与K值确定的好坏影响了最终的拟合效果,非线性回归可避免这一点,我们可以直接拟合曲线=L+K/〔1+a·exp(bx)〕将L、K也作为一待估参数,求出参数。
以上所有计算结果均是在统计软件SAS中编程得到。
【作者简介】 娄冬华(1967-),男,讲师,理学硕士
(收稿日期 1999-04-16)