第二节 基因定位的应用
基因定位和基因图对遗传学、医学和人类及生物进化的研究都有十分重要的意义。它可提供遗传病和其他疾病的诊断的遗传信息,可以指导对这些疾病的致病基因的克隆和对病症病因的分析与认识,这些又取决于遗传图和物理图的相互依赖关系。通过多态位点标记进行连锁分析获得物理图的位置有助于遗传作图,同时通过连锁分析(部分有减数分裂的交换)又能指导物理作图,使基因定位更为精细。
1.连锁分析检测基因突变指导遗传病的诊断 通过遗传连锁图可以在缺少任何生化或分子性质信息情况下对遗传病进行诊断。例如应用RFLP进行的临床诊断(详第十三章)。应当指出,由于多种遗传标记的定位,使RFLP的应用更加广泛。遗传图对疾病诊断的价值最明显的是当某一基因已被定位于某染色体,但尚未被克隆时,就可依赖于运用一个或多个遗传标记进行连锁分析,利用它和该基因的重组关系进行基因诊断。
2.连锁分析进行致病基因的鉴别与定位前段说明已知疾病基因与遗传标记相关进行连锁分析以诊断疾病,然而要认识这种关系就需要:①有足够数量家系来确定这种连锁;②有适当可提供信息DNA标记。后者较易,前者则难,尤其是稀少的疾病,患者在年幼时死亡。这时采取两种方法,一是少数的大家系,并从此家系成员中获得DNA信息,其优点是所有患者都是一个遗传病,并由单一基因突变引起;二是收集大量的小家系。前者如慢性进行性舞蹈病,后者如囊性纤维化(CF)。实际上,人们希望能发现连锁需在大约20cM距离或以下,再大的距离一般就难于发现连锁关系,特别是分子遗传学的新进展推出的反向遗传学――位置克隆的策略,更加速了疾病基因的鉴定与定位。
3.促进对癌基因和瘤抑制基因的定位与克隆,从慢性粒细胞白血病的Ph染色体的发现,了解到是染色体9和22的易位,以及Burkitt淋巴瘤染色体t(8:14)。1982年证实c-myc癌基因定位于8q24,并对其基因分子的结构有了深入认识。现今已知有100多种癌基因和约10种肿瘤抑制基因。而且肿瘤细胞遗传学异常的报道日益增多,到1993年10月,与染色体畸变相关的肿瘤总数达239种,其中结构畸变有188,数目畸变为51种。这些资料就充分说明基因定位和克隆对肿瘤的鉴别定位及其深入研究有着密切关系。当然,基因定位与基因图的发展,也推动了许多常见复杂病的遗传因素的研究。
4.位置克隆与基因定位基因定位的重要应用之一是据此进行基因克隆(gene cloning)。致病基因克隆有两种基本策略:一是功能克隆,二是位置克隆。
(1)功能克隆(funetional cloning):是利用疾病已知的遗传损伤而引起的生化功能如蛋白质基酸缺陷的信息,进行基因定位,进而克隆该致病基因。以进行的基因克隆大都是预先测知疾病基因的编码蛋白质,利用其mRNA反转录成cDNA,再用cDNA作探针,从人基因组中“约”出基因本身。然而,绝大多数遗传病的基因产物不明,就无法用功能克隆策略进行基因克隆。
(2)位置克隆(positional cloning):是先进行基因定位作图,然后找一来自该区的基因并进行克隆,在此之后才能明确该基因的功能。早先称之为逆向遗传学(reverse genetics),但究其基因鉴定到基因定位制图的全过程并非都是“逆向”的,而具遗传学的传统模式,故现多称其为位置克隆。
据HGM93国际会议的资料,至1993年,运用位置克隆策略克隆的人类疾病基因共有26个,其中1993年就有11个,如慢性进行性舞蹈病(HD)基因,肝豆状核变性(Wilson病,WND)基因等。位置克隆的操作过程如图7-4所示。
遗传病致病基因运用位置克隆的成功例子很多,典型之一是假肥大型肌营养不良(DMD)基因的克隆。学者们利用受累女性X染色体与常染色体21的易位,以及男患儿发生小的Xp21.2缺失并伴发3种其它X连锁隐性遗传病,再运用RFLP连锁分析将DMD基因定位于Xp21。Ray等利用了X与21号染色体基因易位,于1986年克隆了该基因的一部分,即XJ系列探针。Kunkel等于同年利用男患儿(B.B)的DNA,通过灵敏的技术提纯得自有Xp21.2缺失的片段,即后来称为pERT87系列的探针。虽然细胞遗传学检查未见此缺失,但患者的DNA中确有
图7-4 位置克隆操作过程图解
图7-5 pERT87系列探针对7个DMD患儿的Sorthern印迹分析
图中患儿1、7无缺失,2-6出现缺失,所有患儿均未见细胞遗传学的缺失
pERT87的缺失,这说明该片段可能是DMD基因的一部分。图7-5表示用DNA印迹杂交法,观察到pERT87区附加的缺失片段(87-1、87-2、87-18等),而且缺失片段不断向此克隆区两侧扩大,表明DMD可能是一个很大的基因。
为证明该区的DNA片段是否含有DMD基因的外显子,又用Northern印迹法检测一个16kb的特异肌肉转录物,接着克隆出它的cDNA,最后证明DMD基因的确很大,约为2300kb,占X染色体的1%以上,该基因编码肌营养不良蛋白(dystrophin),并测出它的氨基酸顺序,该蛋白影响纹肌和心肌的结构和收缩功能。
关于基因定位,近年又兴起一种候选基因方法(candidate gene approach)。此法无需经过基因图和物理图的过程,而根据某种遗传病和特定基因分别定位于染色体的同一区域,而后再发现并鉴定其基因突变,则可研究此致病基因。自1992-1993年用此法克隆基因已有十几个,如SOD1(肌萎缩性侧索硬化症)、RET(多发性内分泌促瘤2A型)基因等。