用“肿瘤标志物”筛查癌症已经成为一部分有钱人或对自身健康格外重视的人的标配。但很少有人提出一个问题:这种筛查真的有用吗?
撰文 | 王晨光
对于关心自己健康的群体,“肿瘤标志物”已经是一个耳熟能详的专业术语。在多数人谈癌色变的大环境下,很多体检机构趁机推出针对健康人的“肿瘤体检套餐”,“滴血验癌”成了推广的噱头。近几年随着基因检测技术的进展,基因测序等手段也借着“精准医学”的口号,被迅速应用到癌症筛查,作为所谓高端体检的内容之一。
那么,这些大行其道、大多数体检机构都在提供的基于血液生物标志物的癌症早筛有没有必要?
答案是明确的:没有必要。不仅没有必要,还有潜在的伤害。大部分公众都不清楚,体检中设置的这些基于生物标志物的项目不合理,不能让受众从体检中获益。医疗机构利用监管的漏洞,滥用这些检测项目,属于违规甚至违法的行为。
有两大类检测项目被体检机构用于癌症筛查,一类是检测血液中那些被认为和癌症有关的蛋白质的水平变化,另一类则是近年来以更先进手段面目出现的癌症相关基因变化的检测。这两类检测的物质统称为肿瘤生物标志物。
根据其来源,生物标志物可以是肿瘤组织的,也可以来自于血液或者其它体液。本文内容将着重于后者,针对癌症体检项目中基于血液样本的生物标志物检测。如非特指,以下提到生物标志物时均指蛋白质或基因的血液指标,这是当前癌症筛查最集中检测的内容。
肿瘤标志物:敏感性和特异性双重缺陷
临床上,肿瘤生物标志物的应用主要体现在以下几个方面:辅助诊断,监控癌症发展,判断治疗手段的疗效,监控癌症复发。
这里是不是漏掉了生物标志物作为体检中癌症筛查的应用?没有遗漏,因为没有一款生物标志物被批准用于癌症早筛。
由于肿瘤标志物可用于评估肿瘤对治疗和预后的反应,研究人员希望它们也可用于癌症早期筛查(无症状阶段)。一项有价值的筛查手段应具有足够高的敏感性(能够正确识别患有该疾病的人)和特异性(能够正确区别没有患病的人)。如果测试是高度敏感的,它将识别大多数患有该疾病的患者。换句话说,只有非常少的患者不能被检测到(低假阴性)。如果测试具有高度特异性,那么只有少数没有癌症的人测试结果阳性(低假阳性)。
尽管肿瘤标志物在确定癌症是否对治疗有反应或评估其是否复发方面有一定价值,但迄今为止未发现一个肿瘤标志物具有足够的敏感性和特异性,从而可单独用于筛查癌症。
例如,通过血液样本测量的前列腺特异性抗原(PSA)测试,曾经用于筛查男性的前列腺癌。然而,PSA水平升高可能是由良性前列腺疾病以及前列腺炎引起的,大多数PSA水平升高的男性并没有前列腺癌。此外,PSA筛查的益处不能抵消一系列确诊检查和治疗带来的危害。因为在大多数情况下,这些癌症并不影响患者的生活质量和生存期。
CA125是另外一种常见肿瘤标志物,有时在患有卵巢癌的女性的血液中升高,在患有囊肿等良性病症的女性中也可升高,但其灵敏度或特异性不足以和阴道超声检查一起用来筛查女性卵巢癌。
还有很多肿瘤标志物如CEA、AFP、CA153、CA724等,也曾被考察是否可用于癌症筛查。遗憾的是,至今没有发现任何一种在健康人群中进行癌症筛查有价值。
多种癌症的早期筛查,对特定人群(不同年龄段、性别、族裔、生活习惯、家族史和其它癌症风险)和特定肿瘤类型的临床价值是明确的,是主流医学界的共识,也是循证医学在癌症筛查上的具体体现。但这和上述体检时通过检测生物标志物水平判断是否患癌完全不同。
对健康人,通过检测肿瘤标志物来做“癌症筛查”实无必要,不仅达不到预想的目的,其检测结果的解释只会带来盲目悲观或盲目乐观。
为什么这样说?因为无论是上世纪90年代以血液中蛋白质为标志物的检测,还是过去10多年以基因为核心的检测,存在的问题都是一致的,那就是这些检测手段用于癌症筛查的临床价值从来没有得到严格的临床试验确认过。不仅如此,多项研究得出了相反的或不支持的结论。
目前临床应用的一些生物标志物,例如前列腺癌的PSA、肝癌的AFP、卵巢癌的CA125或者是胰腺癌的CA19-9,它们的使用是有前提的,可以作为伴随诊断指标,可以用来衡量治疗反应,也可以用来监测复发,但作为单独的指标对健康人进行癌症筛查则没有临床意义,既不能如宣传所讲的做到早诊,也因此谈不上早治。
接下来以胰腺癌患者血液CA19-9检测为例,进一步说明这类生物标志物的适用范围,以及为什么不能被用于无症状和未确诊胰腺癌人群的筛查。以下内容同样适用于其它血液中的肿瘤标志物。
CA19-9(癌抗原19-9)是一种肿瘤生物标志物,由胰腺癌细胞产生并释放到血液中。通过检测血液中CA19-9的蛋白质含量变化,可以推测患者体内胰腺癌的发展情况。
健康人的血液中可能含有少量的CA19-9,这项指标在胰腺癌患者中经常上升很多。尽管不同的患者血液中CA19-9含量差异可能较大,但对同一位患者而言,CA19-9在血液中的含量和患者体内肿瘤细胞多少(肿瘤大小)呈正相关。
因此,检测该标志物水平,可以辅助了解癌症随时间的变化情况,还可以用来考察一种治疗是否有效,以及监测癌症是否复发。癌症确诊后,进行相关肿瘤生物标志物检测,确定治疗前的水平,这些是必要的检测,等于对以后的检测设置了一个“基线”。在治疗过程中,针对确定的标志物可能频繁检测,用来观察治疗效果。治疗结束后的定期随访也将继续检测,为是否有复发和转移提供判断依据。
CA19-9水平还可以作为评判手术是否有必要的辅助指标,超高的CA19-9水平常与肿瘤远端器官转移相关,意味着不具有手术条件。CA19-9水平(变化)对患者的预后判断也有重要意义,例如术后CA19-9水平降低或正常化,与较长的生存期相关。相反,术后CA19-9水平持续高企,则更可能是体内还有残存癌细胞,这些患者更容易复发,而且生存期相对较短。
CA19-9水平还可用于监测肿瘤对手术以及后续治疗的反应,无论是化疗、放疗还是其它靶向或生物疗法。CA19-9水平的下降和治疗方案的有效性相关,如果一种治疗完成后,CA19-9水平没有明显下降甚至上升,则提示该方案无效,需要及时做出调整。
除了检测技术和方法本身的局限性(假阳性和假阴性等),CA19-9水平对于有症状胰腺癌患者的诊断敏感性和特异性分别只有80%左右。即使确诊的I期胰腺癌患者,阳性率也只有40%左右。这就意味着,CA19-9阴性不能作为排除胰腺癌可能的指标,因为部分患者的癌细胞并不产生CA19-9,血清中的含量和健康人没有区别。这已经表明它对健康人的筛查价值极低(灵敏性太低)。
另一方面,每100例CA19-9检测结果呈阳性的无症状健康人,只有不到一位确诊患有癌症。这种情况的学术表述为检测手段的预测值(positive prediction value,PPV)低于1%。这是因为,高水平的CA19-9有可能是胰腺癌的征兆,但也可能是其它类型癌症或某些非癌症疾病的征兆。例如,胰腺炎、胆结石、胆管疾病、肝病、囊性纤维化等,都可能表现出CA19-9血清水平升高。
除胰腺癌外,胆管癌、结直肠癌、胃癌、卵巢癌和膀胱癌患者血液中CA19-9水平也可能升高,只是升高的患者比例更低。因此,这项检测也不能用于这些癌症类型的筛查。
尽管如此,通过检测血液中的蛋白质生物标志物进行癌症早筛,在中国几乎成了体检的标配。美国也曾有机构提供类似服务,例如曾在美国如日中天的Theranos公司。但在美国,这类公司大概率会被法律追究。Elizabeth Holmes(Theranos公司的创始人)和后来加入公司并成为公司总裁和CEO的前男友Ramesh Balwani都因在检测服务中的欺诈行为被重判,并于今年入狱服刑。
目前在美国,几乎没有任何一家医疗机构使用上述生物标志物为健康人提供癌症筛查服务。个别地方可能还保留着针对50岁以上的男性PSA检测,家庭医生也通常会告知没有多大价值。
核酸筛查:另一种算命
过去二十年,随着基因测序技术的发展和高通量分析手段的建立,血液中肿瘤相关基因片段的存在成为另一个关注热点。癌症特异性DNA或RNA作为生物标志物的地位,大有取代上世纪90年代蛋白质因子作为肿瘤标志物的趋势,尤其是在癌症早筛方面的应用。许多公司和研究机构在这个领域开展了大量工作,并在临床价值被验证之前匆忙上市,开始了针对健康人的癌症筛查服务。2016年成立于加州旧金山地区的GRAIL公司便是这个领域的领先者。
也是在2016年,同在美国加州的基因测序仪生产行业的领导者Illumina公司联合比尔·盖兹和亚马逊创始人杰夫·贝索斯,投资1亿美元进军血液检测肿瘤的领域,并于2021年把GRAIL收到旗下,开发基于血液中肿瘤特异性核酸物质的检测,重点应用则是针对健康人的癌症筛查。
此时,这类针对血液中核酸物质的检测已经脱离了一般肿瘤生物标志物的概念,成为另一个专有名词“液体活检”(liquid biopsy)的主力军。
“液体活检”于2010年作为一种新的概念被引入癌症诊断领域,用于检测癌症患者血液中的循环肿瘤细胞 (CTC)。这个概念现在已扩展到循环肿瘤细胞的衍生因子,包括循环DNA (ctDNA)、mRNA、循环微小RNA (cfmiRNA)、长非编码 RNA、小RNA、癌细胞脱落的囊泡 (EV) 等。当然从广义上也包括上述提到的蛋白性生物标志物。液体活检主要样本来源是血液,也包括脑脊液、尿液、痰、腹水和理论上任何其它可采集的体液。
液体活检在理论上是可行的。早在20世纪40年代,人们就已认识到核酸存在于血液中,甚至早于我们认识DNA结构。70年代对这个认识提高了一步,和肿瘤建立起关联。又经过差不多20年,才发现这些DNA携带特定突变。这点很重要,因为提供了血液中有些核酸物质来自癌组织的直接证据,也为检测血液中癌症特异性核酸片段(突变)提供了理论依据。受癌症研究领域进展的启发,香港中文大学的卢煜明教授在微创产前诊断领域取得了进展,结合DNA测序技术的发展,于近年把微创产前诊断成功应用到临床实践。
DNA测序技术经过过去二十多年的长足发展,目前在技术实现上不是个大问题。但液体活检用于筛查癌症所存在的问题和蛋白质标志物是一样的,这点从这些标志物发现过程就可以看出端倪。那就是在已确诊癌症患者血液中找出不同于健康人的成分,反过来利用这些成分去对健康人做癌症筛查。
理解这个问题,可以做一种类比,不妨从曾流行的“血型和性格”入手。
血型就那么有限的几种,而可以描述的每个人的特点几乎是无限的,例如你的性格、口味、身体特征、兴趣爱好、出生时刻等,这些特征的组合更是天文数字,而这种组合决定了一个人不同于其他人。但分析这些特征的时候,不同的人群总能找到一些共同的特征,有些人在做了有限的观察之后,发现某种血型的人具备一些该型的“共同特征”,然后就作为真理传播,并被用来作为推测性格特征的工具。
当然血型和性格的关系是完全没有科学基础的,例子不一定很恰当,但其操作过程和实现血液检测肿瘤的技术有一定可比性。很多这类的研究起始于比较肿瘤患者和健康人的DNA差异,经过复杂统计计算,得出了一组基因突变是肿瘤患者特有的(共同特征),然后应用这些变化推测健康人是否有肿瘤发生。
为进一步理解基于血液中癌症特征性基因片段检测技术是否可用于癌症早筛,我们有必要先来认识一下该领域的热点——多种癌症早期检测 (multi-cancer early detection,MCED)。
MCED技术开发者声称测试有可能从单个血液样本中发现多种癌症。检测血液样本中癌细胞中的某些特征性物质(DNA或蛋白质片段)。如果发现这些特征性,则意味着该人可能患有癌症。这点还不足以吸引人的关注,开发者进而声称检测结果还可能显示癌症发生在哪个部位(器官)。
不同的MCED检测方法正在开发中,上面提到的GRAIL公司开发的产品Galleri已经用于癌症筛查。我们就以此为例,看看这款产品究竟如何。
Galleri被宣传为能够检测出50多种癌症,这条消息曾在两年前占据了很多媒体的头条位置。媒体经常会找出一些患者讲述他们的亲身经历,来佐证这项技术如何可以救命。但这些媒体在报道中极少关注该筛查产品的技术细节以及存在的问题。
早期研发阶段的数据表明(研究基于确诊癌症患者),Galleri对I期癌症的检出率不足40%,II期是69%,III期83%,IV期92%。
另一项验证研究结果显示,Galleri对于确诊癌症的总体阳性率为52%,III期和IV期(晚期)癌症患者的检出率分别为77%和90%。但Galleri对早期癌症的检出率很低,I期和II期分别为17%和40%。
最近,一项在英国开展的基于非(确诊)癌症人群的筛查临床试验结果发布。这是一项多中心、前瞻性观察研究。纳入临床试验的对象包括有非特异性症状或可能有妇科癌症、肺癌或消化道癌症相关症状的患者,确诊的癌症患者则被排除在外。研究者对从参与者血液中分离的DNA进行Galleri检测,随后将检测结果和标准临床诊断结果做比较。
共有5461名参与者得到可评估的检测结果和临床诊断结果,被纳入最终队列进行分析。323例病例的检测结果提示有癌症,其中244例最终被确诊为癌症,阳性预测值为75.5%。这项前瞻性研究的结论和前述研发过程中的数据基本一致,都表现出检测方法的敏感性随癌症分期增加而增加,这项研究的I期癌症检出率是24.2%。
但就是这样一款对I期确诊患者的整体检出率只有不到1/4的产品,竟然被开发者和媒体鼓吹为创新性和革命性的突破,并被用在了早期癌症筛查上。
这还仅是检测技术手段存在的问题,或者说是利用血液中核酸生物标志物对癌症筛查在技术上的局限性,这种局限性也决定了血液筛查有限的临床价值。一方面是较低(甚至不存在)的临床收益,一方面是明确的健康风险(进一步的诊断和过度治疗),这决定了血液筛查肿瘤没有实用价值。
但这还不是问题的全部。
单有筛查还远远不够
要充分认识这类检测手段存在什么问题,还要搞清楚癌症筛查和早诊断的目的是什么,接下来才是目前的技术手段能否实现以及实现后到底能做什么等一系列问题。
筛查和早诊断的目的,仅仅是为了知道一个人有没有癌症吗?显然不是。主要目的是为了发现肿瘤后能提前干预,减少死于癌症的风险和延长患者寿命。因此,理论和技术可行性并不足以支持血液检测肿瘤的临床使用,关键问题是临床是否有需求,以及是否为肿瘤临床治疗预后提供帮助,让患者从中受益。
要真正实现一项技术在临床上的应用和展示它可以挽救生命,需要对大的人群进行所有癌症类型的前瞻性研究。和研究癌症预防手段一样,在开发和测试筛查与早期检测的干预手段时,经常需要数年到数十年的时间去验证,最重要的标准就是一项新的筛查方法是否减少了最终被确诊患有晚期癌症或死于癌症的人数。许多在早期研究中显示出前景的生物标志物在进一步的测试中,往往因为没有明确的临床收益而被放弃。
再强调一下,单有肿瘤筛选和早期发现是远远不够的,确保有方法对筛查阳性的个人进一步确诊以及确诊后具备有效的临床干预手段至关重要。否则,不管一种方法多灵敏、多特异、多廉价,都不足以作为临床使用的支持证据。
即使这些检测手段100%准确,没有假性阴阳(其实这样的手段是不存在的),灵敏度超出其它检测手段,就能解决问题吗?试想,如果检测结果告诉你身体内有癌细胞,但其它手段却检测不到,除了心理上承担患癌的压力,还有什么价值?而这正是GRAIL等公司MCED的现实问题,也是这些项目的自相矛盾所在。晚期有症状患者没必要先经过这项检测结果提示癌症,然后再去做相应癌症确诊性检查。而对于通常不表现癌症相关症状的早期患者,20%的检出阳性率则意味着可能让80%的癌症患者失去确诊机会。
而那些检测阳性、但用常规手段不能确诊癌症的人,将成为苏文茂单口相声《扔靴子》中的那位住在一楼的房东,为等待楼上租客的第二只靴子落地不得而夜不能寐。
受无创产前分子诊断临床应用的鼓舞和资本的追捧,还会有越来越多的公司把目光瞄向用于健康人肿瘤筛查的“千亿美元”市场,这是资本炒作的盛宴,却可能是民众的健康之患。
本文作者为生物学博士,曾任美国托马斯·杰斐逊大学Sidney Kimmel 癌症中心研究员、癌症生物学系副教授、中国医学科学院放射医学研究所研究员/辐射损伤防护与药物研究室主任、协和医学院教授/博士生导师,目前从事抗肿瘤药物的研发。
参考文献及链接
[1] Ballehaninna UK, Chamberlain RS. The clinical utility of serum CA 19-9 in the diagnosis, prognosis and management of pancreatic adenocarcinoma: An evidence based appraisal. J Gastrointest Oncol. 2012 Jun;3(2):105-19.
[2] https://www.fireengineering.com/industry-news/fdic-intl-2023-postscript-onetest-cancer-helps-spot-early-detection-in-firefighters/#gref
[3] https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(23)01700-2/fulltext
[4] https://www.thelancet.com/journals/lanonc/article/PIIS1470-2045(23)00277-2/fulltext#%20
本文受科普中国·星空计划项目扶持
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。