100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > Nature Communications|深度多组学整合研究揭示恶性脑瘤潜在治疗靶点

Nature Communications|深度多组学整合研究揭示恶性脑瘤潜在治疗靶点

时间:2022-01-31 14:49:13

相关推荐

Nature Communications|深度多组学整合研究揭示恶性脑瘤潜在治疗靶点

本期iProteome为大家带来的是一篇发表在Nature communications 上的关于深度多组学揭示恶性脑瘤治疗靶点的文章。

高通量组学方法为探索癌症生物学中的分子机制提供了前所未有的机会。在本文中,作者展示了由突变的RTK癌基因:PDGFRA和NTRK1驱动的两个神经胶质瘤(HGG)小鼠模型的整个蛋白质组,磷酸化蛋白质组和转录组的深度分析。通过质谱分析鉴定到13,860个蛋白质和30,431个磷酸盐。系统生物学方法鉴定到许多主要调节因子,包括41种激酶和23种转录因子。通路活性计算和小鼠存活率表明NTRK1突变诱导AKT下游靶标(包括MYC和JUN)的活化,驱动正反馈循环以上调多个其他RTK,并且赋予比PDGFRA突变更高的致癌效力。小型gRNA文库CRISPR-Cas9验证筛选显示,56%的受试主要调节因子对NTRK驱动的HGG细胞(包括TFs(Myc和Jun))和代谢激酶(AMPKa1和AMPKa2)的活力调节十分重要。

神经胶质瘤(HGG)是最常见的恶性脑肿瘤,并且具有极高的死亡率。虽然胶质瘤测序的进展已经揭示了全面的全基因组突变情况,但是对基因组改变如何导致特定主调节因子和特定途径失调的机制仍不清楚。以前的HGG蛋白质组学和磷酸化蛋白质组学研究扩展了对HGG信号传导的理解,但是大多数这些尝试都使用了相对浅的蛋白质组学方法。癌症研究领域基本上没有深层HGG蛋白质组学研究。本文中,作者首次提出了一种新的范例,用于鉴别约12,000种基因产物(蛋白质)和> 30,000种磷酸盐,其错误发现率(FDR)约为1%。

在本文中,作者使用蛋白质组,磷酸化蛋白质组和转录组的整合系统生物学分析,比较了两种由致癌受体酪氨酸激酶(RTKs:PDGFRA D842V和TPM3-NTRK1融合)驱动的HGG小鼠模型。在儿童和成人HGG中经常发现血小板衍生的生长因子受体α(PDGFRA)和神经营养性酪氨酸受体激酶(NTRK)的融合基因的突变和扩增。作者使用突变表达的RTK的模型小鼠HGG来研究这些癌症驱动基因下游的信号传导网络。通过综合的生物信息学管道,确定了在HGG中重新连接的各种功能模块和主调节因子,并证明TPM3-NTRK1致癌基因上调多个其他RTK以在PI3K-AKT途径内形成正反馈环,从而推动更快速的肿瘤生长。最后,作者进行了CRISPR-Cas9验证筛选,以显示作为RTK-PI3K-AKT下游转录因子(TF)和关键代谢传感器激酶的多种主要调节因子对于NTRK驱动的HGG细胞的存活至关重要。

为了产生深度小鼠HGG蛋白质组和磷酸化蛋白质组的图谱,作者使用了新开发的具有广泛肽分离能力和高质量分离度的MS方法。通过颅内植入用PDGFRA D842V突变或TPM3-NTRK1融合转导的p53无效原代星形胶质细胞产生小鼠HGG模型,这两种致癌RTK均在人HGG中发现(Figure 1a,分别称为PDGFRA HGG和NTRK HGG)。两种模型均产生具有高度有丝分裂多形性肿瘤细胞的HGG,其中许多具有星形胶质细胞分化的特征。HGGs作为肿瘤细胞,在肿瘤边界明显侵入周围实质的区域(Figure 1b)。将HGG和正常小鼠皮质(对照)样品进行蛋白质组,磷酸化蛋白质组和转录组分析。TMT标记用于实现10个样品的大规模平行蛋白质组和磷酸化蛋白质组定量(Figure 1c)。进行广泛的碱性pH反相液相色谱(LC)预分馏,然后进行超长酸性pH反相LC以促进最大肽分离。结果,鉴定了13,860个蛋白质(11,941个基因产物,200,454个肽和3,264,804个MS2扫描)和30,431个磷酸化位点(5959个磷酸化蛋白,45,574个磷酸肽,1,829,889个MS2扫描)(<1%FDR,Figure 1c)。其中,在每个样品中量化了13,567种蛋白质(11,718种基因产物)和28,527种磷酸盐,代表了迄今为止可获得的最深的HGG蛋白质组数据集之一。

为了评估数据集的质量,作者检查了两种转导的人癌基因的MS基因结果,与之前研究中报道的通过蛋白质印迹法测定的相比较,外源人PDGFRA D842V和TPM3-NTRK1的蛋白质表达水平与HGG基因型一致(Figure 1d)。特定磷酸盐的MS数据也与先前在这些HGG小鼠模型中描述的免疫印迹测定一致:AKT S473,PRAS40 T247,PDGFRA Y742,S6 S235和S6 S23622。

Figure.1

主成分分析和层次聚类分析显示,两种RTK癌基因驱动不同的蛋白质组,磷酸化蛋白质组和转录组谱(Figure 2a-d)。在MS分析中,组内重复样品显示出具有低标准偏差的最小变化,而组间比较显示出具有更大标准偏差的差异。对于转录组分析,来自第二组HGG的RNAseq显示出这些HGG小鼠模型的高重复性(R^2> 0.95)。此外,在小鼠HGG中表达的突变体PDGFRA或NTRK融合基因的表达水平与具有这些突变的人肿瘤细胞中发现的表达水平相关。总之,这些结果表明组学数据集的高质量,并证明两种致癌RTK驱动HGG具有可重复的独特的蛋白质组和磷酸化蛋白质组谱。

作者进一步分析了蛋白质组和转录组的相关性和分析深度。转录水平和蛋白质丰度显示中度相关性(Figure 2e,R^2 = 0.5),与先前报道的数据集一致。首先对转录组应用了FPKM> 1的截止值来滤除低质量数据。在12,842个转录物中,通过MS绘制了10,838个(84%)相应的蛋白质。接下来,在这种无偏见的蛋白质组学分析中研究了每种蛋白质的肽覆盖率。超过96%的蛋白质被至少两种肽鉴定,理论上可观察到的蛋白质序列的平均覆盖率达到42%。此外,作者通过与PhosphoSitePlus数据库(最全面的蛋白质修饰数据库)中所有先前发现的小鼠磷酸盐进行比较来估计磷酸化蛋白质组学分析深度。磷酸化蛋白质组覆盖了从所有细胞类型和组织中收集的大约68%的小鼠磷酸盐,并且包含12,354个不在数据库中的新磷酸盐。总之,这些数据提供了癌症研究中分析的最深的蛋白质组和磷酸化蛋白质组之一的范例。

Figure.2

蛋白质组学分析揭示了HGG网络模块和路径。

首先在小鼠皮层,PDGFR和NTRK HGG中鉴定差异表达的(DE)蛋白,并通过WGCNA和ClueGO包进行基因共表达聚类,途径分析和功能模块分类(Figure 3a)。共鉴定出4703个DE蛋白和6768个DE磷酸盐(2301个磷酸化蛋白),分别分布在5个完整的蛋白质组共表达簇(WP-C)和5个磷酸化酶共表达簇(PP-C)中(Figure 3b,c),产生了67个功能模块。正如预期的那样,与正常皮层相比,肿瘤重新连接的两个最大模块是与肿瘤细胞增殖相关的细胞周期(在WP-C1中,Figure 3d)和PI3K信号级联(在PP-C2中,Figure 3e)。总体而言,包括癌症信号传导,基因表达,细胞粘附,代谢和神经元功能的一系列模块组在HGG肿瘤中重新连接(Figure 3f)。值得注意的是,三个簇(WP-C1,PP-C1和PP-C2)显示相似的改变模式:Cortex <PDGFRA HGG <NTRK HGG(Figure 3b,c),并且大多数已知的神经胶质瘤途径在这三个簇中丰富聚集(Figure 3f),表明NTRK HGG激活类似的致癌途径,且在整体途径水平上的反应幅度大于PDGFRA HGG。此外,大多数HGG癌症信号传导途径仅在磷酸化蛋白质组中改变,但在整个蛋白质组中没有改变(Figure 3f),这是磷酸化蛋白质组学分析在解码致癌信号传导中不可或缺的作用的基础。因此,这些结果表明RTK癌基因在HGG小鼠的磷酸化和蛋白质表达水平上驱动信号传导网络的大量重连。

Figure.3

多组学整合识别主激酶和TF

由于蛋白激酶活性可以通过使用计算机程序的底物磷酸化水平来推断,作者使用机器学习算法IKAP来评估187种激酶的活性,其中41种在小鼠HGG中重编程。分层聚类分析将这些激酶活性分类为多个主要聚类(Figure 4a),类似于Figure 3c中皮质,PDGFRA和NTRK HGG中的三种主要差异调节模式(即PP-C1,PP-C2,PP-C5)。通过检查PhosphoSitePlus数据库中报道的激酶 - 底物关系,这些单个激酶在激酶 - 激酶信号转导网络中进一步连接(Figure 4b)。在HGG中鉴定了多种已知的神经胶质瘤中的激酶,包括AKT,PKC,MAP激酶级联和SRC家族激酶。调节细胞内的其他关键激酶也被重新连接,包括AMPK(PRKAA1,PRKAA2)和p21激活的激酶(PAK1,PAK3)。AMPK是一种代谢主传感器,可调节葡萄糖转运蛋白GLUT4的产生,脂肪酸β-氧化。PAKs调节细胞骨架重组和细胞运动。与正常皮质相比,HGG还显示更高水平的CDK5,CAMK2A和CAMK2D。尽管这些激酶是神经元功能和突触可塑性的充分表征的调节因子,但它们也在胶质母细胞瘤中表达,其中它们在迁移,侵袭,线粒体调节和钙信号传导中起作用。作者进一步总结了这些激酶在激酶超家族水平上的活性。而AGC(环核苷酸依赖家族,蛋白激酶C家族,核糖体S6家族和相关激酶),CMGC(细胞周期蛋白依赖性激酶,丝裂原活化蛋白激酶,糖原合成酶激酶和cdk样激酶)和CAMK(主要是激酶调节)通过调节超家族激酶在HGG肿瘤中具有显着活性(p值通过Fisher精确检验确定,并且应用截止值0.001,),NTRK HGGs在AGC和CMGC超家族中显示出更高的活性(Figure 4c)。

考虑到AKT是RTK激活后PI3K-AKT信号级联的中心节点,作者进一步分析了AKT底物激酶活化的影响(Figure 4d)。34个AKT底物显示与AKT活性一致的磷酸化模式。活性较高的AKT底物是细胞周期和增殖调节剂(CHEK1 S280和BRCA1 S686),中枢葡萄糖代谢调节剂(例如AMPKA1 S496和AS160 T649),以及迁移和血管生成调节剂(例如eNOS S1176,VIM S39和FLNC S2234,Figure 4d)。其他激酶 - 底物连接的核心调节获得了类似的结果(AMPKA1,CDK5,MAPK3,ATR,ATM,PAK1和FYN)。总之,综合激酶活性分析能够在两种HGG肿瘤模型中鉴定主激酶和激酶活化的下游结果,其中PI3K途径激活由人HGG中发现的不同受体酪氨酸激酶突变驱动。

Figure.4

作者还通过系统生物学方法在多个步骤中通过小鼠HGG中转录组,蛋白质组和磷酸化蛋白质组的整合分析来探索TF的活性(Figure 5a)。共有47个活性TF来源于转录组中的靶基因表达,其中38个TF能够通过MS鉴定到。额外的完整蛋白质组和磷酸化蛋白质组数据显示38个TF中23个具有活性(Figure 5b)。一致地,REST靶基因在肿瘤中表达较低而在正常皮质中较高(Figure 5b),指出REST通过抑制靶基因表达而在HGG肿瘤转化中可能的作用。因此,这种整合分析揭示了TF激活剂和抑制剂的活化,导致肿瘤细胞转录组和蛋白质组的不同重编程。

最后,作者在HGG中构建了一个以激酶-TF为中心的网络,通过将已知激酶与激酶和TF结合到PhosphoSitePlus数据库和ENCODE数据库中的基因连接,在数据集中具有一致的共激活模式,从而形成简化的激酶-TF中心网络,由五种激酶(AKT1,MAPK3,CDK5,PRKCA和AMPK)和六种TF(c-MYC,JUND,JUN,EP300,BRCA1和CEBPB)组成(Figure 5c)。c-MYC家族(MYC,MAX)和AP-1家族(JUN,JUND)调节肿瘤发生中的各种中心生物学过程。实际上,超过100个c-MYC靶标具有转录活性,显示c-MYC在HGG肿瘤中的中心作用(Figure 5c)。

对主要TF的分析揭示了HGG中主要的转录激活的下游生物过程(Figure 5c)。活性最高的生物过程与增殖有关,包括核糖体生物形成,翻译和RNA加工(c-MYC,BRCA1和CEBPB的靶标),能量代谢包括线粒体和代谢(c-MYC,JUN和EP300的靶标)。迁移包括细胞外基质和粘着斑(JUN和EP300的靶标)。在激酶-TF网络中,c-MYC,JUN和EP300通过主能量和增殖传感器激酶(AMPK和MAPK)的磷酸化被激活。值得注意的是,据报道,由这三种TF激活的多种代谢酶在增殖和能量应激过程中至关重要,例如腺嘌呤磷酸核糖基转移酶(APRT),其调节核苷酸途径以从头合成嘌呤,以及鸟氨酸脱羧酶(ODC1)多胺生物合成响应生长刺激。总之,系统生物学方法利用多层信息来优先分析中心HGG TF,激酶及其在HGG肿瘤中的相互作用。

跨物种组学整合可能是识别人类癌症中致癌因素的有效方法。因此,作者还将小鼠HGG中最显着改变的组学数据集映射回人类转录组数据,以搜索由跨物种的NTRK和PDGFRA突变驱动的一致性改变,从而得到小鼠和人类中20个会聚改变的列表。据报道,这些基因中的大多数在癌症相关过程中具有功能活性,包括癌细胞干细胞,血管生成,肿瘤微环境和入侵的调节,共同突出了物种间分析的潜力,以优先考虑来自大规模多组学的癌症相关候选物,数据集。

Figure.5

在小鼠HGG中,NTRK是比PDGFRA更强的致癌驱动因子

生物信息学分析表明,在NTRK HGG中具有比PDGFRA HGG更强的癌症网络重编能力,表明NTRK的致癌效力高于PDGFRA突变。为了评估RTK癌症驱动基因的致癌效力,作者修改了最初设计用于基因表达分析的PAC算法,以计算总和PI3K-AKT信号传导通路活性。蛋白质活性来自具有已知功能的磷酸盐,其促进或抑制肿瘤发生。在两种HGG中,PI3K-AKT途径明显活跃,并引导类似的下游途径,如蛋白质合成(S6,4EBP1和EIF4B),细胞周期进程(RB1,MYC和RB12),细胞增殖和血管生成(BRCA1,eNOS, ERK)(Figure 6a)。当比较这些在NTRK和PDGFRA HGG之间有统计学差异的蛋白质的27种调节磷酸盐时,大多数(n = 23)NTRK HGG显示出比PDGFRA HGG更高的活性(Figure 6b)。一致地,NTRK HGG表现出1.45倍的PI3K-AKT信号传导活性(P = 0.003),表明TPM3-NTRK1融合基因具有比PDGFRA D842V更强的致癌效力。

为了实验验证预测的TPM3-NTRK1和PDGFRA D842V的致癌效力,作者分析了两种HGG小鼠的细胞增殖指数和Kaplan-Meier存活曲线。量化了4种NTRK1驱动的HGGs和4种PDGFRA驱动的HGGs的增殖指数,其中PI3K-AKT信号传导水平增强,NTRK HGG的增殖指数(0.32±0.04)比PDGFRA HGG的增殖指数高1.45倍(0.22± 0.07),通过Student"s t检验确定p值为0.048。一致地,NTRK HGG小鼠的发生潜伏期比PDGFRA小鼠短得多(中位存活时间分别为16天和30天,Figure 6d)。

Figure.6

TPM3-NTRK1和PDGFRA D842V均激活PI3K-AKT信号传导,但具有不同的效力。PDGFRA蛋白的物种特异性分析鉴定了两种HGG模型之间RTK上调的差异。MS检测显示由人PDGFRA D842V基因驱动的HGG表达比NTRK HGG表达更低水平的蛋白(Figure 7a)。通过小鼠氨基酸序列特异性肽定量内源性小鼠PDGFRA,并通过蛋白质印迹验证该发现(Figure 7b)。许多其他RTK(EphA2,EGFR,FLT4,PTK7和ROR2)在NTRK HGG中也显示出比PDGFRA HGG更高的蛋白质表达活性(Figure 7c)。转录组学分析同样表明这些RTK的上调。蛋白质印迹进一步证实了伴随磷酸化反映的EphA2过表达和活化(Figure 7d)。为了确定驱动RTK表达增加的潜在机制,作者搜索ENCODE和MsigDB数据库以鉴定调节RTK转录的TF并通过其蛋白质水平或磷酸化状态验证TF活性(Figure 7e)。使用Western印迹确认MYC的表达和磷酸化,将其作为代表性的TF(Figure 7f)。总之,这些生物信息学和实验结果表明,NTRK融合基因诱导其他RTK的过度表达和激活,展示PI3K-AKT信号传导中的正向反馈环,导致比PDGFRA驱动的HGG更具侵袭性的肿瘤产生(Figure 7g)。

Figure.7

CRISPR-Cas9筛选验证HGG中的分子靶标

为了检测多组学方法优先分析的主要调节因子是否在肿瘤发生过程中产生重要作用,作者首先建立了从NTRK驱动的HGG小鼠肿瘤组织中收集的HGG原代细胞进行体外培养,然后设计了一个汇集的mini-gRNA文库用于靶向这些因子。包括六个非靶向gRNA作为阴性对照,进行系统的实验优化,例如,通过免疫印迹证实CasG在HGG细胞中稳定表达;通过ZsG的荧光检测验证gRNA整合;通过筛选前的深度测序证实了合并文库中每种gRNA的相对均匀分布,并且一式三份进行筛选以获得重复性。

作者在CRISPR-Cas9筛选期间靶向两种类型的主要调节因子(激酶和TF),包括来自转录组和蛋白质组数据的9个基因(Figure 8b),并且还靶向通过与小鼠和人类的跨物种比较鉴定的6个基因。与起始群体相比,在选择15天后三个双重gRNA计数中的两个显着降低,则认为靶基因对于肿瘤活力是重要的。在此截止值下,没有阴性对照gRNA富集。另一方面,56%(9个中的5个)主调节剂被证明对HGG肿瘤生长至关重要。值得注意的是,发现调节细胞代谢的所有三种激酶(即PRKAA1,PRKAA2和EEF2K)都有助于HGG细胞活力的增加,从而提供新的肿瘤易感性。此外,两种TF(Jun和Myc)在筛选中经证明是阳性。鉴于RTK-PI3K-AKT诱导广泛的下游变化,精确定位Jun和Myc可以获得有关RTK融合如何诱导HGG肿瘤发生的信息。因此,这种CRISPR-Cas9筛选揭示了新的能量代谢肿瘤易感性,以及Jun和Myc参与NTRK融合诱导的肿瘤发生,共同证实了多组学整合方法发现主要调节因子的有效性。

Figure.8

本文中,作者提供了一个通用的生物信息学管道,用于优先分析核心信号网络和癌症蛋白质组学研究中的主要调控因子,首先进行加权共表达聚类分析,从4703个差异表达的蛋白质和6768个差异磷酸化的磷酸盐中提取10个蛋白质组和磷酸化蛋白质组,从而大大降低了数据的复杂性。容易鉴定出在胶质瘤生长中具有公认作用的主要途径以及与RTK活化下游的PI3K和mTOR信号传导的明确联系。随后,使用网络分析方法将每个群集中的核心基因汇总到传导途径和网络,进一步将这些大规模变化缩小到67个网络模块。作者还通过整合多组学数据和各种数据库,进一步优先考虑41种激酶,23种TF,以及由来自这些基因簇和网络模块的9种主要调节因子组成的核心网络,开发了激酶和TF的系统蛋白质活性推断策略。

此外,这种方法可以扩展到简单的途径识别,以说明两种癌基因之间的差异。即使在正常组织中的相似细胞环境中,也需要不同RTK下游信号传导的特性来转导由不同配体驱动的不同功能结果。致癌NTRK融合基因在各种类型的癌症中发现频率较低。在大脑中,NTRK融合可以在成人或儿童HGG中发现,其中包括多种其他突变,并且它们也存在于婴儿HGG和儿童低级别神经胶质瘤中,其中可以检测到非常少的非同义突变。生物环境和同时突变的差异进一步使直接比较人类肿瘤中不同RTK突变的下游效应的能力变得复杂。

考虑到患者样本中基因组背景的高度复杂性,将小鼠模型中最显着改变的组学变化映射回人类数据可能是探索由患者中特定癌基因驱动的生物学机制的有效方法。CRISPR-Cas9筛选也被设计为靶向通过跨物种组学数据整合优先化的六个基因(即Cd93,Cd74,Epha2,Spry1,Arhgap18和Dab2)。Cd93对NTRK驱动的HGG原代细胞的生长至关重要。由于针对相同基因的所有gRNA的低切割效率,其他候选物可能未能从筛选中富集。然而,跨物种整合存在一些局限性:(i)高度有限的患者样本可用性(即只有8名患有PDGFRA突变的患者和3名患有NTRK1融合的患者)限制了统计学的应用; (ii)患者的大的变化(例如起源的肿瘤细胞,肿瘤生长环境,患者年龄和肿瘤等级)也使数据整合混乱。但是,这种方法对于大量人体样本的组学研究很有用。

随着组学技术的快速发展和大数据集的积累,这种集成的生物信息学管道为癌症组学研究中的主基因和核心信号网络的优先级提供了一个通用平台。结合CRISPR-Cas9功能筛选,该管道将增强对致癌过程的机制理解并阐明潜在的治疗靶点。

作者:杨国建

编辑:刀刀

原文引用:/10.1038/s41467-019-11661-4

往期精彩:

Nature Methods|Proteoform鉴定的五级分类系统

Nature Methods|定量磷酸化肽段位置异构体的新方案---Thesaurus

Nature Communications|乳腺癌定量蛋白质组学和蛋白质基因组学研究

点击关注了解更多精彩内容!!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。