精准肿瘤学的关键目标是改善癌症的诊断和治疗。而对肿瘤样本的一系列基因组和其它分子分析能够帮助发现标志物来帮助选择疗法,预测预后,跟踪肿瘤进化,以及发现不同转移性疾病的分子特征。基于下一代基因组测序(NGS)的分子分析方法已经在肿瘤分析方面得到应用,而综合DNA、RNA、蛋白质和表观遗传特征的多参数综合分析可能更准确地描述肿瘤特征并且帮助发现全新成药靶点。
目前,精准肿瘤学的焦点愈发转向液体活检,因为它不具侵袭性,而且可以在不同时间点重复进行,从而帮助监察疾病的进展。如今,外周血液中可以被检测的分析物(analyte)包括循环肿瘤细胞(CTCs);循环无细胞DNA(cfDNA),在癌症患者中它包含循环肿瘤DNA(ctDNA)。其它分析物物包括循环无细胞RNA(cfRNA);细胞外囊泡(EVs),例如外泌体和肿瘤“教育”的血小板(TEPs);蛋白质和代谢产物。近日,《Nature Reviews Genetics》 对在精准肿瘤领域液体活检的现状和未来进行了盘点,在今天的这篇文章里,药明康德的微信团队将与读者分享这篇综述的精彩内容。
ctDNA检测是目前市场上最常见的液体活检形式,它在具备巨大潜力的同时,在检测开发和临床应用的推广方面也面对着一系列挑战。
ctDNA作为精准肿瘤学生物标志物的潜力
研究表明,ctDNA可能由凋亡细胞释放,因此,它只代表了肿瘤细胞的一种特定亚群。尽管如此,ctDNA具有多个优点:
1. 它能够提供对肿瘤基因组的综合描述,因为ctDNA从多个不同肿瘤区域或多个病灶处释放,ctDNA分析可以发现组织活检中无法发现的体细胞突变。
2. 深度测序可以发现肿瘤内异质性和只在部分细胞中出现的基因突变。这通常需要大量的CTCs或者多次组织活检才能获得同样水平的信息。
3. ctDNA可以提供肿瘤大小的信息,从而反映出疾病的发展状态和对疗法的反应。研究发现,在非小细胞肺癌(NSCLC)和高级别浆液性卵巢癌(HGSOC)中ctDNA的突变等位基因频率(VAF)与肿瘤体积呈线性关系。
4. ctDNA还具备预测预后的价值。例如,在旨在治愈的手术或化疗之后,ctDNA的出现是癌症复发和不良预后的有力标志。它预测癌症复发的能力在结肠癌、卵巢癌、肺癌和乳腺癌患者中都得到了验证。
5. ctDNA分析能够发现肿瘤抗性的标志物,例如,在接受抗EGFR疗法的结直肠癌患者中出现的KRAS突变,以及在乳腺癌患者中的PIK3CA、MED1、或EGFR上VAFs的升高。
这些优点让ctDNA成为精准肿瘤学应用方面前景看好的分析物。然而ctDNA检测也需要克服血浆中ctDNA水平过低,细胞衰老带来基因变异的影响等挑战。
▲组织活检与ctDNA检测特点对比(图片来源:参考资料[1])
血浆中低水平ctDNA带来的挑战
在血浆cfDNA中检测到基因突变的能力与肿瘤负担有对应的关系。但是在不同患者身上的ctDNA水平可能相差很大,虽然他们患上同样类型的癌症。即使是在转移性癌症患者中,也有很大一部分患者血浆中ctDNA的比例异常的少。这清楚地表明,除了肿瘤负担以外,还有其它生物因素影响肿瘤DNA的释放。
据估算,1毫升血浆中含有大约1500个基因组当量(GE)的DNA片段,通常一次10毫升抽血可以从血样中获得4毫升血浆,意味着能够获得6000 GE的DNA片段。在VAF为0.1%的情况下,在这6000 GE的DNA片段中,平均只有6个DNA分子携带着想要检测到的基因突变,而且随机取样可能会影响这一数值。因此,可靠、准确并且可重复地检测到这些基因突变是一个严峻的挑战。
检测低水平ctDNA的方法
如果增加血样体积,可以检测到的分子数目自然会显著上升,但是多抽血的办法通常在晚期癌症患者中无法实现。另外一种克服携带基因突变的分子数目过少的方法是同时检测多种基因突变,然后确定一个基因突变数目的最低阈值来决定血浆样本是否为肿瘤阳性。例如,有的液体活检可以同时检验患者是否携带18种单核苷酸位点变异(SNV),如果检测到的SNV数目超过2个,则将ctDNA样本定义为肿瘤阳性。
近年来ctDNA检测技术的开发主要聚焦于增强测序技术的分析敏感度。测序技术的敏感度会受到测序准确性和测序深度的影响。通过使用分子条形码标记被测序的DNA片段,可以提高测序的准确性,从而提高发现基因突变的几率。
另一种提高敏感度的尝试是富集特定长度的ctDNA片段。有研究表明ctDNA 片段(132-145个碱基对)通常比健康细胞释放的cfDNA片段(~166碱基对)小。因此,富集特定大小的DNA片段进行测序可能提高发现基因突变的敏感度。
▲影响循环无细胞DNA检测敏感度的因素(图片来源:参考资料[1])
细胞衰老对ctDNA检测的限制
虽然这些技术的进步能够改善发现低VAF基因突变的能力,但是衰老细胞积累的体细胞突变也会对ctDNA的实用性添加限制。其中一个重要的干扰因素是良性体细胞基因突变随着细胞衰老而增加。在成人干细胞中出现的良性基因突变会随着细胞增殖传给下一代,有的时候在肿瘤驱动基因中出现的基因突变会导致携带这些突变的干细胞增殖速度更快,这可能被误认为肿瘤增生。因此,在肿瘤驱动基因中发现基因突变并不等同于发现癌症。
ctDNA检测的分析效度和临床有效性仍需确认
在临床护理中采纳肿瘤生物标志物检测的原则有三条:1. 分析效度(analytical validity),指的是检测的准确性、可靠性和可重复性;2. 临床有效性(clinical validity),指的是检测能够把患者分为不同群体,而且这些群体会有不同临床后果的能力;3. 临床实用性(clinical utility),指的是接受检测的患者的临床后果与未接受检测的患者相比,是否有所改善。
目前,市场上的ctDNA 检测的结果一致性和临床有效性还未得到完全确认。有研究使用两种不同的ctDNA检测方法对同一批样本进行检测,试验结果表明,在34个接受检测的样本中,只有9个样本在两种ctDNA检测中给出了完全一致的结果。这种数据让人对这些检测的分析效度和临床有效性产生疑虑。目前,业界需要进行多中心研究,使用足够大的患者群来确认ctDNA检测的分析效度和临床有效性。
而且,检测的标准操作程序和指导需要得到统一。欧洲标准化委员会(CEN)已经发布了处理和纪录用于ctDNA分析的血样的标准程序。其它国际组织也在致力于将液体活检的流程标准化。如果想将基于NGS的液体活检在临床中广泛推广,它们必需接受完备的检验并且通过基于确认标准的质量检测。
以精准肿瘤学的需求来看,现有的液体活检技术还存在很多不足。但通过扩大信息获取与检测的范围,我们有望实现液体活检技术的真正潜力。在这一段中,我们也将介绍目前新兴的一些液体活检方法。
1. 组织与癌症特异的DNA甲基化模式分析
在表观遗传学中,CpG的甲基化是基因表达和组织分化的重要调控方式。近年来,随着人们对组织特异甲基化组学的了解不断加深,通过分析甲基化的模式,我们可以推断出cfDNA的组织来源,检测癌症。由于在癌症发病初期,DNA就会出现甲基化修饰的变化,该技术有望在早期就协助医生做出癌症诊断。这一理念已经在实验中得到了验证——2017年的两篇论文表明,我们有望在乳腺癌和卵巢癌得到临床确诊的2年前,就在外周血液中检测出肿瘤特异的甲基化变化。但这一技术目前也存在着瓶颈,主要难点在于获取足够数量的循环肿瘤细胞,以及对于单细胞甲基化模式的分析。
2. 核小体位置分析
血液中cfDNA的主要形式是受单个核小体保护(mononucleosomal protected)的DNA。和甲基化模式类似,来自不同细胞的cfDNA,其核小体所处的位置也有所不同。因此通过对这些核小体位置的分析,我们也能推导出cfDNA的来源。
3. miRNA分析
在生物学研究中,循环RNA在RNA-seq,qPCR,以及microarray等方面有着多样的应用。在诸多RNA内,miRNA由于其在血浆或血清中的稳定性得到了广泛的关注,也有不少人期望能将其开发成有用的诊断工具。举例来讲,有些科学家希望能使用低剂量计算机断层扫描(low-dose computed tomography ,LDCT)技术,在高风险的个体中对肺癌进行早期检测。而miRNA的评估有望减少LDCT技术较高的假阳性率。一些研究表明,miRNA与LDCT技术的结合,能将后者的假阳性率减少5倍!
▲不同液体活检分析方法面对的挑战和潜在解决方法(图片来源:参考资料[1])
4. 分析细胞外囊泡的转录组和基因组
细胞外囊泡是核酸与蛋白质的载体,在细胞与细胞,乃至器官与器官间的交流中起到了重要作用。从运输能力上看,细胞外囊泡最多能运载近100个蛋白质和约10kb长的核酸。在核酸方面,miRNA大约占了40.4%,piwi-互作RNA占了约40%,剩下的则是假基因(pseudo genes),lncRNA,tRNA,以及mRNA。这些RNA分子中的信息有望用于确认癌症起源,做出早期诊断。除了核酸分子外,细胞外囊泡上的一些粘附分子(如整合素)也能用于推断器官特异的癌症转移。
值得一提的是,外泌体(exosome)可以由活性癌细胞直接分泌。与ctDNA进行配合,可以从多个角度展示肿瘤的生物学特征,做出更准确的诊断。当然,健康组织也会分泌大量外泌体,其中的遗传物质也会带有变异。因此在临床应用上,我们还需要更好地对外泌体的行动进行追踪。
5. 经过肿瘤“教育”的血小板
肿瘤细胞有时会将生物分子转移到血小板上,这个过程也被形象地称为“教育血小板”。有趣的是,这些信息可以被用于区分癌症患者。在一项研究中,科学家们收集了228个癌症样本,而对于这些经过肿瘤“教育”的血小板进行RNA-seq,科学家们可以将局部和转移癌症患者与健康人区分开来,准确度达84%-96%。区分肿瘤来源的准确度也达到了71%。这是因为不同的癌症类型,会把不同的分子带给血小板。当然,这一技术目前还停留在较初步的阶段。为了让它得到更好的应用,我们还需要了解肿瘤“教育”血小板的具体过程。
6. 蛋白质分析
细胞的正常运作离不开蛋白质,而许多疾病的根源正是蛋白质的突变。然而除了PSA(前列腺特异抗原)外,目前临床上我们能使用的蛋白标志物少之又少,且大多无法区分其来自哪些组织或癌症。蛋白质组学的蓬勃发展给了人们契机,让我们建立了高质量的蛋白关联性图谱。目前,我们已经可以利用这些技术,明显提高液体活检在早期癌症中的检测率。
7. 代谢物分析
肿瘤的生长发育往往会影响到人体生理上的变化,尤其是全身的代谢状况。对于肿瘤来说,它们能肆意改变自己的代谢通路,而血液中的代谢产物可能会成为有用的癌症标志物。目前比较为人熟知的一个案例是BCAA,它能预示肿瘤发育早期对代谢调控的干扰——胰腺癌的发病早期,BCAA水平会有所上升。而在非小细胞肺癌里,BCAA的水平则会下降。这些结果表明代谢物的组成可能成为液体活检的重要部分。
8. 活性循环肿瘤细胞分析
近年来,单细胞分析技术有了飞跃式的发展,这也让科学家们得以更为详细地分析循环肿瘤细胞内的基因组、转录组、蛋白质、以及表观遗传组信息。其中,来自活性循环肿瘤细胞的信息对于评估癌症转移有着重要的作用。除此之外,这些细胞也能被用来建立患者特异的肿瘤模型。但首先,我们还需要解决不同癌症种类中循环肿瘤细胞的丰度问题。比如非小细胞肺癌就很少会带来循环肿瘤细胞。
任何一项技术在刚刚迈入应用之际,总是充满了挑战,液体活检也不例外。尽管有多种新兴分析方法不断涌现,但这一技术的发展前方依旧充满挑战。
1.真正理解血浆成分
关于液体活检最大的争议之一,在于我们是否真正了解了血浆成分。举例来讲,过去人们认为ctDNA主要来自凋亡的癌细胞,但最近对ctDNA的一些分析却找到了一些和癌细胞增殖有关的变化,刷新了认知。因此为了更好地理解细胞如何将DNA释放到循环系统中,我们还需要更深入地了解健康人与癌症患者中,血浆的组分与各个组织之间是怎样的一个关系。截止到目前,我们做的还非常不够。
举例来说,不少关于组织特异性的研究,其专注的只有少数集中细胞类型,探索血浆cfDNA来源的研究也寥寥无几。这容易给分析带来偏差——不少研究指出白血球是循环核酸的主要来源,占比范围在42%-90%。然而最近的一项研究却发现,幼红细胞来源的DNA在健康人里,中位占比大概是30.1%,而这是先前人们从来没有报道过的组织来源。可想而知,不同的分析方法得出的结论究竟有多大的区别,这也反映了我们对于血浆cfDNA组成的无知。
2. 液体活检与免疫肿瘤学
液体活检与免疫肿瘤学的交织,是最近的研究热点之一。当循环肿瘤细胞离开原发肿瘤之后,就会暴露在免疫监控之下。因此,它们也需要一定的免疫逃逸机制才能生存。目前我们已经知道,这些循环肿瘤细胞有能力改变自己的MHC I呈递、改变NK细胞配体表达、或是下调FAS/FASL的表达。理解这些变化,有助于免疫肿瘤学的发展。
通过对循环肿瘤细胞进行液体活检,还能带来实际的应用价值。最近,人们通过抗PD-L1抗体,发现在这些细胞上也有PD-L1的表达。这些信息可以用于患者细分。
此外,我们还能通过分析ctDNA里的肿瘤突变负担(TMB),了解检查点抑制剂的潜在效果。这是因为TMB越高,产生新抗原的几率就越高。一些研究也表明,TMB能用来找到哪些患者在免疫疗法的治疗后,在临床上能有更好的预后。
▲综合多种参数,从液体活检样本中发现癌症(图片来源:参考资料[1])
3. 对多种参数的测量与整合
如果要给液体活检展望一下未来,成功检测最小残留病灶可以说是一个目标。最终,我们希望能在早期对癌症进行诊断。要实现这些目标,有时我们只需要检测一个指标就够了。最近,2017年药明康德生命化学研究奖得主卢煜明教授领衔的一支团队发现,只要在外周血液里检测Epstein–Barr病毒的DNA,就能筛选出早期的鼻咽癌患者。许多专家认为这项研究堪称是里程碑。
但更多的情况下,一个指标是远远不够的。在涉及多个指标的案例中,我们还需要考虑参数整合的问题。在最早的一些尝试中,人们主要综合的是ctDNA与蛋白标志物。举例来说,CA19-9、TIMP1、以及LRG1等蛋白标志物,辅以对KRAS基因突变的检测,能够找到肿瘤可切除的前列腺癌患者,且检测率要高于只使用ctDNA的方法。
最近,一种叫做CancerSEEK的早期癌症检测策略浮出水面。在一项招募了1005名志愿者,涉及8种常见癌症类型的临床研究中,蛋白质与遗传标志物的组合,猜对癌种的中位正确率为70%。由于致癌基因突变未必具有组织特异性,想要区分癌症的来源,还是要靠对蛋白质的分析。但这种技术容易带来假阳性,且在早期癌症的检测中效果不佳。
尽管如此,研究人员们依旧指出,通过整合不同标志物的分析结果,液体活检的潜力看好。在前列腺癌与胰腺癌的诊疗上,我们已取得了一些可喜的进展。
4. 机器学习遇上液体活检
人们也意识到,综合考量多种指标需要较高的计算能力,而机器学习算法则有望自动发现和检测癌症特异的指标,助力液体活检。这可能涉及简单的逻辑回归,也可能涉及复杂的多层人工神经网络。
事实上,机器学习技术已经在液体活检中取得了一些成绩。比如利用深度学习的方法,我们能以更高的灵敏度和特异性去探测循环肿瘤细胞;用基于神经网络的miRNA分析,我们可以区分健康女性和罹患卵巢癌的女性,特异性达100%。
但目前利用机器学习算法的最大短板,在于独立观察数据的不足。该综述指出,目前患者的样本量一般在几十到几千之间,而按碱基的分辨率计算,单名患者就可能产生数百亿的数据。在理想的情况下,设置机器学习算法时,前者应比后者的数量来得更多。比如经典的图像处理AI,处理的样本高达数百万,而潜在的分析特征只有几千,两者的数量级之间有着明显的差距。在数据不足的前提下,机器学习算法可能会出现过度拟合。它能很好地解释训练数据,但无法用于新的数据。
液体活检在肿瘤学方面的应用日益增多。然而,我们需要对液体分析物的产生机理和水平动态进行更深入的了解,同时需要确认液体活检的临床有效性和临床实用性,这样才能进一步推广液体活检的临床应用。
目前,大多数检测都只聚焦于一种分析物,然而将血液中存在的多种分析物的数据综合起来构成的多参数检测可能大幅度改善检测的精确度和使用范围。这些检测技术的开发需要使用创新统计工具,它们能够使用多维机器学习方法来整合从一个样本中获取的大量数据。
因此,未来的液体活检研发将横跨多个学科,包括基础生物学和生理学、分子生物学、检测技术、统计学和机器学习。非常关键的一点是,只有当液体活检的临床有效性和临床实用性得到证明之后,这项技术才能发挥它全部的潜力,为基因组驱动的肿瘤学和癌症患者的临床管理带来重大影响。
参考资料:
[1] Heitzer et al., (2018). Current and future perspectives of liquid biopsies in genomics- driven oncology. Nature Reviews Genetics, https://doi.org/10.1038/s41576-018-0071-5
本文来自药明康德微信团队,欢迎转发到朋友圈,谢绝转载到其他平台;如有开设白名单需求,请在文章底部留言;如有其他合作需求,请联系wuxi_media@wuxiapptec.com
来源:药明康德