肺癌临床研究和循证医学
CSCO2000年第四届学术年会
吴一龙
关键词:肺癌;治疗;研究
一、问题的提出
作为恶性肿瘤谱中最重要的癌瘤之一的肺癌,每年世界范围内诊断的新病例超过了50万例,国内的肺癌死亡率上升也较快,20世纪90年代达20.41/10万。对于这一发病率日益增长的肿瘤,尽管投入了大量的人力物力进行研究,但令人遗憾的是,治疗效果一直不尽人意。
是什么原因使得肺癌的生存率裹足不前呢?
让我们首先来看看非小细胞肺癌术后辅助性放射治疗的研究情况。
从1933年首例的肺癌全肺切除术以来,手术一直是非小细胞肺癌的首选治疗方法。然而,即使是完全性切除的肺癌病例,其5年生存率也仅在40%左右,治疗失败的原因,主要在肺癌的局部复发和转移上。既然外科手术对肺癌的局部控制不足,同为局部治疗手段的放射治疗,自然被列入肺癌的术后辅助治疗计划中。
下面是一些研究结果:
肺癌研究组于1986年报道了230例的非小细胞肺癌病人术后放射治疗的随机研究,结论是术后放疗能减少N2病人的复发,但不能提高生存率。同样结论的报道也见于相隔10年后的1996年,英国的Stephens等报道了16个中心308名病人的随机研究,结论是术后放射治疗能减少和推迟局部复发和骨转移,但不能提高生存率。
澳大利亚的Mayer等1998年报道了155名NSCLC病人的随机研究,结论为尽管目前的结果还没有统计学的意义(P=0.07),但术后放射治疗的趋向是可能有延长总生存率和无复发生存率的作用。
美国著名的Mayo医院的一项回顾性研究,把224名接受了术后放射治疗的病人,按术后复发危险性的高低和生存情况分成高危险、中危险、低危险三个组进行分析,结论是高、中危险组的病人能从术后放疗中获益,而低危险组的病人则效果不确切。
俄罗斯Bartchuk等702例的回顾性研究结果显示,术后放射治疗明显地提高了生存率和减少了局部复发率。法国Lafitte等报道了160例T2N0M0的早期非小细胞肺癌术后放射治疗的结果,结论是对这一期的肺癌,术后放射治疗既不能减少局部复发率,也不能提高生存率。国内汪楣等166例的随机分组研究,术后放射治疗明显降低了局部复发,但3,5年生存率与单纯手术组比较没有统计学的差异。钱浩和王瑞芝等分别于1993和1995年报道认为,如果手术切除彻底,无残留淋巴结,非小细胞肺癌症术后做不做放疗对生存率无影响。
上述引用的文献,来自不同的国家不同的研究时间段,但结论相当的不一致。因此,当我们在引经据典地为我们的临床实践或进一步的临床研究寻找根据时,我们只能说,非小细胞肺癌术后是否辅助性放射治疗仍有争论。
在非小细胞肺癌的临床研究中,类似的问题还有:转移性肺癌用化学治疗还是用支持疗法、ⅢB期非小细胞肺癌的治疗、生物治疗在肺癌治疗中的作用、肺癌恶性胸水的治疗模式、新辅助放化疗在非小细胞肺癌治疗中的价值、小细胞肺癌是否需要辅助性手术治疗,等等。对这些问题,我们有哪一项能确切地回答?
问题在于,我们能一直用这些有争议的治疗模式来处理每一个需要得到最好治疗照顾的肺癌病人吗?不恰当的过分治疗,既对病人不利也是对有限的医学资源的浪费。另一方面,仍按此进行临床研究,是否再过十年二十年,我们仍只能同10年20年前一样只得出有争议的结论吗?需要新的临床研究方法。
二、系统评估的研究方法
对上述有关完全性切除的非小细胞肺癌术后放射治疗文献的剖析发现,对同一问题的研究,不管是例数的多少,均涉及到统计学的权重,也即P值是否有意义的问题。对同一问题得出不同的结论,其中一个值得考虑的是研究对象的例数是否足够。举一个例子,如果期望通过术后放射治疗,把非小细胞肺癌的5年生存率从50%提高到60%,即提高10%的绝对生存率,那么需要900例的研究才能从统计学的角度回答辅助性放射治疗是否有价值。如果要把生存率从5%提高到55%,则需要3500例的研究对象。显然,依靠一个研究中心是难于甚至是不可能达到目的的,即使是联合多个中心共同进行研究,也难于达到这么多的样本量,由此,就有可能应该得出阳性结果的研究,却因例数不够而导致统计学上的无意义。因此,需要引进系统评估的研究方法。另一方面,每年在全世界范围内2万多份杂志上发表的生物医学文献超过2百万篇,任何一个人不可能一一阅读和消化,需要把这些有关的文献精简成精华才能有效地利用。
所谓的系统评估(systematic reviews),指的是用一些系统的方法来尽可能地减少偏倚和随机误差。研究者用系统的方法来鉴别、判别和提炼假说,认识和避免以前工作的陷阱,估计样本量,描述主要的不良反应和确定进一步的研究方向。系统评估最常用的方法是Meta分析法。
现举几个例子加以说明。
1998年英国Stewart等发表了非小细胞肺癌术后放射治疗的Meta分析报告。该研究总共收集了9个随机对照研究,其中有3个是没有发表的研究,病例数达2128例。1056例接受术后放射治疗的肺癌病人已有707例死亡,1072例单独手术的肺癌病人也有661例死亡。中位随访时间为3.9年。结果是,术后放射治疗对生存率有负面影响,死亡危险性增加了21%,等于2年生存率下降了7%,即从55%降为48%。进一步的亚组分析,负影响最大的为N0N1的Ⅰ、Ⅱ期病人,N2病人的负影响则不明显。因此,术后放射治疗不适于完全切除的早期非小细胞肺癌病人,不应列为常规使用。至于N2病例,术后放射治疗的作用仍难于确定,需进一步研究。
另一个例子是关于非小细胞肺癌的化疗问题。1995年非小细胞肺癌协作组在BMJ杂志上发表了该问题的Meta分析报告,该研究由52项随机研究组成,涉及9387名病人,其中已死亡的7151例,同样包括了部分未出版的研究。结论是,含有铂类的化疗方案能提高病人的生存率,术后加上化疗与单独手术比较,减少了死亡危险13%,5年生存率提高5%;放射治疗联合化学治疗比起单独的放射治疗,死亡危险减少了13%,2年生存率提高4%;支持疗法联合化学治疗,比起单独的支持疗法,死亡危险减少了27%,1年生存率提高10%。
从上述两个Meta分析,我们可总结出几个特点:
首先是纳入研究的均是随机对照研究,样本数总量达数千例,保证了统计学处理的需要,更由于包括了未出版的资料,可纠正绝大部分公开发表的文献只报阳性结果的所谓出版偏差。其次是结论均是数量化且有统计学处理,能更直接地回答待解决问题的是与否。第三是研究结果是解决临床中某些一直混淆不清的有争议问题,是一种真正的临床研究手段。
当然, Meta分析不等于就是系统评估的方法。在某些情况下,譬如出版的资料不能用来计算比数比(odds ratio),研究方案的设计存在异质性等等,均使得Meta分析不能进行。1998年Sculier等在评价小细胞肺癌维持化疗的作用时,使用了另一种系统评估的方法——文献的批判性综述(A Critical Review of the Literature),这种方法的实质是一种定性评分法,采用评分表来评价方案设计和方案分析的质量,获得分数最高的研究方案,其结论就最可信。与Meta分析相比较,这一种定性评分法并不能得到基于统计学处理的结论,因此对期待解决的问题可能得不到明确的答案,但它耗时少,在不能采用定量分析方法时,不失为一个较好的定性方法。
Sculier等采用的计分表为欧洲肺癌工作协会 (European Lung Cancer Working Party,
eLCWP) 设计的质量评分表,该表分方案描述研究和分析报告研究两部分,每一部分再分成若干小项,每一项满分为2分,该项如果研究方案或分析报告完全没有提及的为0分,仅部分提及或虽涉及但不充分者为1分,描述清晰和完全的为2分。如在方案设计中毒性项,没有涉及的得分为0,只涉及部分毒性的得分为1,按WHO标准观察毒性的得分为2。所有项目得分相加占总分的百分数为总得分,分数越高研究质量越有代表性。从1980年到1996年,总共13个随机研究进入评分,结论是小细胞肺癌的维持化疗有一定的适应证,在方法学上,目前已发表的研究质量总体上不尽人意,越近发表的研究质量越最好,未来需要有好的高质量(即计分高)的研究。
类似的评分法还有Chalmers法。系统评估的另一个重要方面是确定证据的可靠性,称为对证据的批判性评估。经过大量的评估,美国肿瘤临床协会提出了临床证据可靠性的五个级别,可以大体上评估海量文献中结论的可靠性。这五个级别为:
级别Ⅰ:研究结论来自对所有设计良好且有对照的临床研究的meta分析。低假阳性或假阴性的随机研究(高权重)。
级别Ⅱ:研究结论至少来自一个设计良好的随机对照临床试验,高假阳性或假阴性的随机研究(低权重)。
级别 Ⅲ:研究结论来自设计良好的准临床试验,如非随机的、单组对照的、前后队列、时间序列或配对病例对照系列。
级别 Ⅳ:结论来自于设计良好的非临床试验,如比较和相关描述和病例研究。级别 Ⅴ:病例报告和临床总结。
不同的研究机构的证据可靠性的评估有不同的标准,但其基本要点均是以统计学的基本原则来确定的。
三、临床随机对照研究的方法
系统评估的基础是临床随机对照研究结果。随机对照研究之所以日益受到重视,在于它能够排除病例选择和分配中的偏性,能够平衡研究组和对照组间已知的或未知的预后因素或其他影响因素,也能够保证统计检验的有效性。由于这些优点,使得临床随机对照研究能有效地确定研究组和对照组间的获益,增加了结果交流的可信度。不同于基础医学的随机对照研究,影响临床随机研究过程的因素特别多,其中一个主要原因是研究主体和研究客体是处在一个平等的位置上,研究客体随时可提出退出研究项目的要求并付诸行动,研究主体不可能也没有权利来阻止这一行动,另一方面,研究客体可能自作主张地增加或减少某些干预措施,这导致了资料分析的偏性,从统计学角度看,这称为研究对象的依从性问题(compliance)。同时,研究客体是人,因此,在研究方案中绝不能出现有害甚至无效的研究步骤。基于上述的考虑,临床随机研究必须遵守下述的原则:
要评价的方法必须经过严格的临床前研究,具有充分的科学依据。涉及到新的药品或设备时,要经有关部门批准。那种把动物实验结果轻易地应用到人体上的做法,是完全违背伦理道德原则的。
要遵从受试对象有知情权的原则。应把研究目的、方法、预期的结果和可能出现的不良反应告知受试者,并签署知情同意书。
要严格地设计研究方案。方案的目的要明确,研究人群的选择、排除、中途退出都必须有严格的标准,观察指标必须明朗具有可测定性,生存率应作为金标准,随访观察的合理安排和统计学方法的设计应用均需包括在研究方案中。研究方案一旦确定,在整个研究过程中应维持基本不变,非改变不可的要提出充分的理由和经过详细的论证。
这里着重要强调的是病人的依从性问题。由于治疗方案的不良反应和治疗时间的跨度,特别是晚期肺癌治疗效果的不确定性,甚至由于经济的承受能力等原因,因此在临床实践中让病人百分之百的遵从所设计的方案完成治疗疗程几乎是不可能的。病人要么在治疗中途退出治疗方案,要么自己增加或减少某些干预措施,这些情况称为病人对研究的非依从性(noncomplaince)。非依从性增加了资料分析的复杂性,甚至严重地影响对结果的判断。在资料分析中提出对非依从性处理的一个办法是去除这些病例,这一做法的最大问题是增加了资料的偏性(bias),因为这些病人有可能就是研究方案中有别于依从性好的又同预后密切相关的病例,在治疗分析中去除这些病例自然地会影响到结果的判断,这是结果判断中“质”的问题。因此,90年代提出了对非依从性病例的“蓄意处理原则(intention-to treat,ITT),其中心思想是不论依从性的水平如何,所有进入随机研究方案的病例均必须包括在结果资料的分析中,尽管这同样会影响到结果分析,但这是结果判断中“量”的问题,可通过增加样本量的方法来加以解决这一偏性。其大概估算是这样的,5%的非依从率,需增加25%的样本量;10%的非依从率,需增加样本量50%;如果非依从性率达到15%,则样本量要增加一倍以上。
资料收集要规范化。既往的临床工作存在的一大缺陷是资料收集的随意性。缺乏规范的记录内容、记录格式,使得我们的日常工作仅仅在于完成了某一例病人的处理,当我们回过头来想对工作做一番总结,才发现原来的记录缺这缺那,我们浪费了原来可以收集到的信息。实际上,回顾性研究之所以被认为可靠性不足,原因之一就在于回顾性所收集到的信息的完整性和可靠性不足,影响了结果的判断。因此,利用计算机技术的进步,设计和使用肺癌的电子病历系统以规范资料的收集和应用,是现在和未来肺癌临床研究一个必不可少的工具,也只有使用电子病历系统,才能使肺癌临床研究的水平提高到一个新的水平。
四、肺癌的临床指引方法
临床指引(clinical guideline)是使用系统方法建立起来的对某一特定临床问题处理过程的描述,其作用是帮助医患双方正确选择诊断和治疗决策,以让病人能得到最适当的医疗照顾。
临床指引的制定有三种方法,即基于专家意见(expert opinion)、基于一致性方法(consensus methods)和基于证据方法(evidence-based methods)三种。
基于专家意见的临床指引,是针对某一临床问题征求这一领域的专家的意见,然后根据专家们的建议制定出相应的指引以规范临床行为。专家的意见之所以能作为临床指引,在于专家有丰富的临床经验,对医学进展甚至对未发表的研究结果的了解,对科学依据的合理解释,在决策过程中能够用他们的经验和知识来综合各方面的意见,而一旦形成指引,专家的权威和号召力,使得病人和下级医生更容易按指引执行诊治计划从而增加了指引的可行性和有效性。但从系统方法的角度看,基于专家意见的临床指引,仍是一种非结构化的、非正式的指引,其缺陷主要表现在于专家的意见往往是经验性的而非分析性的、主观色彩比较浓的。如对同一临床问题,即使是已有了明确证据的,专家的观点仍可能存在着不一致;专家的偏好往往在潜意识上左右着对科学杂志上发表的文献的结果的选择。因此,基于专家的意见的临床指引,就可能是没有“自觉的、准确的、公正的根据现有最好的证据来决定对每一个病人的治疗选择”。现在临床上常常使用的专家组会诊形式和每一所医院制定的单病种诊治常规,基本上是属于这一类型的,因此有它在临床决策上的局限性。
基于一致性方法与基于专家的方法相似,但有若干的技术改进。代表不同观点的专家被邀请参加专题会议,讨论对某一临床问题的临床行为,最终取得一致性意见,形成对所讨论问题医疗处理的推荐意见供临床医生参照执行。因此,基于一致性方法所产生的推荐意见是一种正式的、结构性的指引。当一项实验室研究已取得明显的证据在向临床实践过渡的阶段,特别是当研究结论用于临床尚嫌较为薄弱或出现矛盾时,这种方法显得特别有用。美国国立健康研究所一致性发展项目(the national institutes of health consensus development program)在这方面作了大量的工作。我们来看看基于一致性方法建立的临床指引的实例。美国临床肿瘤协会(ASCO)有关肺癌的一条临床指引是:不能切除的Ⅲ期非小细胞肺癌,采用化学治疗和放射治疗时,专家组的一致性意见是化疗疗程不要超过8个周期。制定本指引的专家组由肿瘤内科、放射肿瘤学、胸外科和肺内科等临床方面的专家,还有专注于临床研究、医疗决策、医学经济、生活质量、医学伦理等方面的专家,更包括了病人代表等所组成。专家组制定本指引的依据是,有两个随机研究说明了两个疗程的顺铂加长春碱化疗后接胸部放射治疗,比起单独的放射治疗能有意义地延长局部晚期非小细胞肺癌的生存期。但对此类病人化疗的持续时间一直得不到很好的研究,最有指导意义的系统性研究是非小细胞肺癌合作组的meta分析,但其中并没有对化疗疗程作主要研究,仅仅是提到以铂类为基础的化疗方案在2~8个周期之间。较老的研究有对病人持续化疗直到病情进展为止的,但这一模式并不能改善这些病人的生存期,遗憾的是该研究的药物是以烷化剂为主,因而不足以说明问题。另外,对化疗放疗反应十分良好的病人,再手术的作用也难于确定。专家组对证据不是十分确切的这一问题讨论的结果,形成的一致性意见就是“化疗疗程不要超过8个疗程”的指引了。
建立一个基于证据的临床指引(evidence-based clinical practice guidelines, EB-CPGs)是一个耗时、费力的过程。它的核心是系统综述。正如上文所提的,系统综述是一门正式的、明确的方法学,用来寻找、汇总、选择、综合、分析、解释和报告某一问题的研究结论。基于证据的临床指引就是汇总众多相关的系统综述结论,形成对某一个特定病的临床诊治规范,用于指导阶段性的临床行为。当然,按目前的现状,一个囊括某一疾病从预防、诊断、治疗、预后到随访各方面的临床指引,不可能都有系统性综述作为指引的依据,因此,基于一致性的方法也常常被结合到一个大的指引之中。不管怎么说,一个好的临床指引,应该体现出正确性、可靠性、可重复性,临床上的可操作性、灵活性,应体现出多学科、公开、求证、文件化的特点。1997年美国临床肿瘤协会(ASCO)制定了一个“不能切除的非小细胞肺癌治疗临床指引”,就包括了基于证据和基于一致性的两种方法,同时,也规定了指引每年必须根据已发表的证据更新的时间性。英国York大学1998年发表的“肺癌的处理”,是另一个很有特色的基于证据的临床指引。其中对肺癌的放射治疗,提倡把6周30次60Gy的传统放射治疗方法改为所谓的“连续超分割加速放射治疗”,即CHART法,其依据就是多中心的临床随机研究已说明CHART能减少死亡率(危害比0.76,95%的可信度在0.63~0.92间,P值为0.004),2年存活率29%比传统疗法的20%高。该指引还特别强调,其所采用的证据有效期在1年时间左右,届时可能有新的依据可利用,临床肿瘤学家应随时根据新的证据做出对病人最有利的诊断和治疗选择。
综上所述,肺癌临床研究的方向,应是围绕如何“自觉的、准确的、公正的根据现有最好的证据来决定对每一个肺癌病人的治疗选择”这一目的来进行。它的思路,应是在临床中发现问题,然后带着这一问题在文献中寻找最好的证据,一旦有了证据,即应对这些证据进行批判性的评估,评估后确定为最好的证据,则列为临床指引指导临床工作;如果不能确定为最好的证据,即应设计临床随机对照研究,或采用基于专家组的一致性意见作为临床指引,经过临床研究从而得到新的最好证据再次指导临床,最终均是使病人受益。
作者单位:(中山医科大学肺癌研究中心、附属三院)
参考文献
1. Parkin DM, Saxo AJ. Lung cancer: worldwide variation in occurrence and proportion attributable to tobacco use[J]. Lung Cancer 1993;9(suppl):1-16
2. 李连弟, 鲁凤珠, 张思维, 等. 1990-1992年中国恶性肿瘤死亡流行分布情况分析[J]. 中华肿瘤杂志. 1996;18:403-407
3. 吴一龙, 黄植蕃, 戎铁华, 等. 肺癌外科治疗效果的动态对照研究[J]. 中华胸心血管外科杂志. 1992;8(4):250-252
4. Lung Cancer Study Group. Effects of postoperative mediastinal radiation on completely resected stage II and stage III epidermoid cancer of the lung[J]. N Engl J Med. 1986;315(22):1377-81.
5. Stephens RJ, Girling DJ, Bleehen NM, et al. The role of post-operative radiotherapy in non-small-cell lung cancer: a multicentre randomised trial in patients with pathologically staged T1-2, N1-2, M0 disease[J]. Br J Cancer. 1996;74(4):632-9.
6. Mayer R, Smolle-Juettner FM, Szolar D, et al. Postoperative radiotherapy in radically resected non-small cell lung cancer[J]. Chest. 1997;112(4):954-9
7. Sawyer TE, Bonner JA, Gould PM,et al. Effectiveness of postoperative irradiation in stage IIIA non-small cell lung cancer according to regression tree analyses of recurrence risks[J]. Ann Thorac Surg. 1997;64(5):1402-8.
8. Bartchuk AS, Kanaev SV, Wagner RI, et al. Significance of adjuvant radiotherapy in the surgical treatment of patients with non-small-cell lung cancer[J]. Vopr Onkol. 1998;44(2):159-63.
9. Lafitte JJ, Ribet ME, Prevost BM, et al. Postresection irradiation for T2 N0 M0 non-small cell carcinoma: a prospective, randomized study[J]. Ann Thorac Surg. 1996;62(3):830-4.
10. 汪楣,谷酰之, 殷蔚伯, 等. 非小细胞未分化肺癌根治术后放射治疗的临床研究[J]. 中华放射肿瘤学杂志 1994;3:39-43
11. 钱浩, 蒋国樑, 王丽娟, 等. 非小细胞肺癌术后放疗511例分析[J]. 中华放射肿瘤学杂志, 1993;2(4):235
12. 王瑞芝, 李明淑, 邓晓芹, 等. 非小细胞肺癌不同治疗方法疗效例分析[J]. 中华放射肿瘤学杂志, 1995;4(1):34-36
13. PORT Meta-analysis Trialists Group. Postoperative radiotherapy in non-small-cell lung cancer: systematic review and meta-analysis of individual patient data from nine randomised control trials[J]. Lancet, 1998;352:257-63
14. Liberati A. The potential and limitations of evidence-based medicine[M]. ASCO Educational Book 1998:446-450
15. Non-small Cell Lung Cancer Collaborative Group. Chemotherapy in non-small cell lung cancer: a meta-analysis updated data on individual patients from 52 randomised clinical trial[J]. BMJ,1995;311:899-909
16. Sculier JP, Berghmans T, Castaigne C, et al. Maintenance chemotherapy for small cell lung cancer: a critical review of the literature[J]. Lung Cancer 1998;19:141-151
17. Φsterlind K. Cancer reviews need to be systematic --- but how[J]? Lung Cancer 1998;19:99-100
18. Chalmers TC, Smith H Jr, Blackburn B, et al. A method for assessing the quality of a randomized clinical trial[J]. Control Clin Trials 1981;2:31-49
19. Sackett DL, Rosemberg WMC, Gray JAM, et al. Evidence-based medicine:: What it is and what it is not[J]. Br Med J 1996;312:71-72
20. Kosecoff J, Kanouse D, Rogers WH, et al. Effects of the National Institutes of Health Consensus Development Program on physician practice[J]. JAMA 1987;258:2708-2713
21. American Society of Clinical Oncology. Clinical Practice Guidelines for the Treatment of unresectable non-small cell lung cancer[J]. J Clin Oncol 1997;15:2996-3018
22. Green SB. Basics of clinical trial design and interpretation[M]。ASCO Educational Book. 1999:107-111
23. Ellenberg SS. Noncompliance in clinical trials and the intention-to treat principle[M]. ASCO Educational Book. 1997:196-198
24. 吴一龙 马国胜 万德森 等. 以病人信息为中心的医院信息系统的建设[J]. 中国医院管理 1998;18:44-45
25. University of York. Management of lung cancer[J]. Effective Health Care 1998;4:1-12
26. Saunders M, Dische S, Barrett A, et al. Continuous hyperfractionated acceletated radiotherapy in non-small-cell lung cancer: a randomised multicentre trial[J]. Lancet 1997;350:161-5