肿瘤是一种由多基因参与的复杂疾病,其基因表达分析涉及转录组及蛋白质组学(Proteomics)等的方法。随着蛋白质组学概念的提出, 肿瘤研究已逐渐成熟进入后基因时代, 研究人员从组织和细胞蛋白整体水平研究肿瘤成为可能。蛋白组学研究技术已经应用于肿瘤标志物的寻找和鉴定,通过不懈的努力,科学家们已在肾癌细胞内发现相关诊断标志并建立了膀胱癌相关蛋白数据库;肝癌的研究中也发现了可用于早期诊断和肿瘤分型的蛋白等,因此基于蛋白质组学整体水平进行肿瘤相关研究已成为目前研究的热点。
什么是蛋白组学?
蛋白质组学是1994年由科学家Marc Wilkins提出,指的是在有机体、系统或生物环境中产生的一组蛋白质,我们可以指一个物种的蛋白质组(例如人)或一个器官的蛋白质组(例如肝脏)。蛋白质组不是恒定的,它随细胞的不同而不同,并随着时间的推移而变化,故蛋白质组具有高度动态性及细胞特异性,一个有机体的不同细胞能够表达出它的全部蛋白的不同阶段。在某种程度上,蛋白质组反映了潜在的转录组。然而除了相关基因的表达水平外,蛋白质的活性(通常由蛋白质参与的过程的反应速度来评估)也受到许多因素的调节。
图1. 蛋白质组学领域
蛋白质组学实验通常收集样品中蛋白质的三个特性的数据:位置,丰度/周转率和翻译后修饰。
蛋白质组学研究的技术有哪些?
1. 蛋白质组学分离技术(凝胶和非凝胶)
图2. 蛋白质样品和色同步蛋白标记物的SDS-PAGE
蛋白质的分离技术是蛋白质组学的基础。目前蛋白质组学常用的分离技术包括两种,一种是凝胶技术双向凝胶电泳技术及双向荧光差异凝胶电泳技术;另一种是非凝胶技术,主要是色谱技术,包括高效液相色谱和多维液相色谱。
2. 基于生物质谱技术的蛋白质组学鉴定技术
蛋白质鉴定技术在蛋白组学中是关键的部分。生物质谱技术是其中的一门技术,是研究中的主要支撑。质谱技术可以分为电喷雾电离质谱和基质辅助激光解析电离质谱两类。
图3.蛋白质鉴定的流程:蛋白质提取、纯化、鉴定。
3. 蛋白质组学定量技术
目前定量蛋白质组学技术主要分为标记策略和非标记的定量策略,其中标记策略又分为体内标记(如 SILAC、15N 标记),以及体外标记(如 iTRAQ、TMT 标记)。传统的基于2D双向凝胶电泳分离的蛋白质组对全蛋白质组的覆盖较低且不能满足高通量定量蛋白质表达谱分析的要求。安必奇生物结合样品制备与高分辨率、高灵敏度的液相色谱-质谱联用技术,可在细胞与组织类样品中鉴定多个蛋白,对全蛋白质组的覆盖率较高。结合生物信息学分析,为您构建高通量蛋白质定量表达谱。
图4. 液相色谱质谱联用仪
4. 基于生物信息学的蛋白质组学数据的分析处理技术
蛋白质组学研究涉及蛋白质表达模式研究和功能模式研究, 目前以前者研究较为集中。蛋白质表达模式研究的支撑技术主要有蛋白质的分离、鉴定技术和生物信息学。生物信息学应用于构建和分析2D电泳图谱及数据库的搜索和构建。目前应用较为普遍的是NRDB数据库及dbEST数据库。
蛋白组学在肿瘤中的应用
1. 三阴性乳腺癌的基因组和转录图谱
图5. 3例阴性乳腺癌的分子分型(Jiang YZ等,2019)。
乳腺癌分为四大亚型,三阴性乳腺癌治疗难度较大。该研究以465例中国原发性三阴性乳腺癌(TNBC)患者为研究对象收集肿瘤组织及癌旁组织,利用WES、RNA-seq和CNV芯片技术获得突变位点、差异表达基因分析和CNV位点进行肿瘤分型,对419例发生突变或拷贝数变异的TNBC样本进行mRNA亚型和突变谱分类,绘制三阴性乳腺癌基因组图谱。在该队列中观察到的显著的癌症相关突变是TP53突变(在74%的肿瘤中发现),其次是PIK3CA(18%)、KMT2C(7%)和PTEN(6%)突变(图1A和1B)。通过评估体细胞拷贝数改变(CNAS)与已报道的癌基因和肿瘤抑制基因改变之间的关系,发现MYC是受体细胞中CNAS常见的受影响基因。
图6. LAR亚型中激活的ERBB2与细胞周期信号转导。(Jiang YZ等,2019)
该文章不仅使用了蛋白组学的研究方法,更是结合了基因组学及生物信息学同时完成对乳腺癌的研究,对分子亚型特征进行了重要验证,并发现了新的潜在靶点和特定亚型的生物标志物,有助于改善靶向治疗。
2. 蛋白质组学研究揭示肝癌发生机制
慢性乙型肝炎病毒(HBV)感染是导致肝癌的重要原因。新药研究需要“源头创新”,研究肝癌的分子分型以及与分型相关的潜在生物标志物和药物靶点,将助力肝癌个性化用药的发展。2019年Cell发表了较新的肝癌多组学研究,该研究对159例HBV感染的肝细胞癌患者和癌旁肝组织标本进行了蛋白质基因组研究,对基因突变、基因表达谱、蛋白质组和磷酸化蛋白质组等多维数据进行了分析,全面揭示了肝癌的分子特征,全面分析了肝癌的发生发展机制,为肝癌的准确分型和个体化治疗、疗效监测和预后监测提供了新思路与策略。
图7. 利用蛋白组学及多组学方法对慢性乙型肝炎病毒进行全面分析(Gao Q等,2019)。
首先,该研究揭示了我国肝癌突变谱与西方肝癌突变谱的差异。研究发现35%的样本含有马兜铃酸诱导的基因突变“指纹”,突变“指纹”增加了肿瘤突变负荷,与微环境免疫耐受显著相关,提示该类型肝癌免疫治疗的潜在价值。通过对染色体拷贝数变异的深入分析,揭示了染色体4Q和16Q的缺失将通过反式效应影响细胞周期相关蛋白,促进肝癌的发生发展。其次,根据蛋白质组学数据,将肝癌患者分为三种亚型且临床预后差异显著,其预后价值不依赖于临床常用的TNM分期,有望为肝癌的个性化精准治疗和临床预后判断提供指导。最后,该研究系统地揭示了代谢异常在肝癌发生发展中的重要作用。这些数据表明,在HBV感染的HCC肿瘤中,肝脏特异性功能经历了代谢重编程。该研究还从多组学水平系统解释了肝癌中各种细胞代谢和信号通路的变化趋势。因此,靶向调控代谢途径可能在肝癌的防治中发挥重要作用。
图8. CHCC-HBV队列中CNA拷贝数改变及其与磷酸化蛋白水平的相关性、HBV受体和胆汁酸代谢在HBV相关性肝癌中下调,ALDOA-Ser36磷酸化驱动肝癌细胞糖酵解和增殖(Gao Q等,2019)。
3. 启早发性胃癌的蛋白质组学分析
在2019年发表在《癌细胞》杂志上的一篇早发性胃癌蛋白质组学文章中,利用肿瘤多组调控机制,研究人员获取了80名患者的肿瘤组织和邻近正常组织,使用外显子测序肿瘤组织;外周血单核细胞对外周肿瘤组织的mRNA测序;通过整体蛋白质组、磷酸化蛋白质组和N-糖化蛋白质组(均针对肿瘤组织和邻近正常组织)分析了早发性胃癌的蛋白质组学。
图9. 综合蛋白质组学分析鉴定EOGC亚型(Mun DG等,2019)。
在本文中,研究人员发现了6个显著突变基因。在分析了体细胞SNV与蛋白质磷酸化水平的相关性、mRNA与蛋白质log2-FoldChange的相关性等后,EOGC队列共鉴定出6个显著突变基因。比较了EOGC和前身LOGC三种GC类型中非同义体细胞SNV的频率。在三个队列共有的四个重要突变基因中,在包含这些突变基因的样本中发现了磷酸化水平。其中,3个突变基因(CDH1、ARIDA、RHOA)在80个蛋白中表现出突变-磷酸化相关。CDH1突变失活会导致可遗传的弥漫性胃癌。作者发现,根据蛋白质水平发现关键突变并不比基于高水平mRNA表达的突变更有效。mRNA-蛋白质相关性可以用来对原癌基因进行分类。蛋白质丰度、磷酸化和糖基化数据在癌症分型中为mRNA提供了补充信息。EOGC和LOGC的突变基因重叠非常罕见,说明两种胃癌的突变格局有很大不同。弥漫性肿瘤与非弥漫性肿瘤在mRNA水平上存在显著差异。因此,蛋白组学与其他组学的联合分析更加有助于在肿瘤领域的精准数据的得出。
图10. 综合蛋白质组学分析鉴定EOGC亚型(Mun DG等,2019)。
参考文献:
Jiang YZ; et al. Genomic and transcriptomic landscape of triple-negative breast cancers: subtypes and treatment strategies. Cancer cell, 2019, 35.
Gao Q; et al. Integrated Proteogenomic Characterization of HBV-Related Hepatocellular Carcinoma. Cell, 2019, 179.
Mun DG; et al. Proteogenomic characterization of human early-onset gastric cancer. Cancer cell, 2019, 35.