时隔好久再次动笔。
癌症基因组的分析内容如下:
其中驱动基因突变是很重要的热点方向。
驱动基因突变定义:体细胞突变,为癌细胞生长带来优势,在克隆发展过程中起到不可替代的关键作用,受正向选择。
研究难点:癌症基因组中99%突变是乘客突变(passenger mutation),加上测序错误等因素,真正找到癌症的突变基因还是很有很难的。
所以现在寻找肿瘤驱动基因突变的方法有如下3种:
1. 驱动基因已知数据库:a. CGC(Cancer Genomic Census): COSMIC的驱动基因数据库,现阶段有699个驱动基因。分为Tie1(明确的数据证明此基因与癌症活动有关)和Tie2(潜在目标,很少数据证明)。
b.MDG125:发现125个突变基因(Multi-driver gene),71个TSG和54个oncogene。
原癌基因:具有热点突变区域,区域内反复出现相同突变,突变会激活基因进而增加细胞的选择性生长优势
抑癌基因:突变散布在整个基因内,一般没有热点区域,通过截短突变使基因失去活性。
c. SMG127:是利用TCGA数据库中12种癌症的3281例样本,结合MuSiC软件的预测结果(高频突变)和转录组数据(过滤低表达),最终发现127个可靠的驱动基因。
d. CDG291:12个癌症的3205个样本,利用4种不同模式对驱动基因进行预测,最后找出291个可信癌症驱动基因以及144个候选驱动基因。
2. 寻找驱动基因——基于SNV的研究
(基于碱基突变)
寻找方法:通过构建分析模型,寻找与驱动突变相关的“信号”。
a. 模型1:高频基因突变(SMG),用MuSiC/MutsigCV软件。
b. 模型2:功能缺陷基因(对基因功能影响的打分),用OncodriveFM软件。
c. 模型3:成簇突变基因(空间上:功能获得性突变:往往蛋白的某些特定区域聚集形成突变簇),用OncodriveCLUST软件。
3. 寻找驱动基因——基于CNV研究
获得事件:原癌基因拷贝增加
丢失事件:抑癌基因拷贝减少或丢失
大量CNV都是随机发生,并不受选择。利用GISTIC软件鉴定肿瘤样本反复出现的高频CNV,并通过高频CNV找出与肿瘤发生发展的相关基因。
高频CNV分类
a. 染色体水平(arm-level):峰范围广(>25%染色体长度),包含基因多
b. Focal水平:峰范围窄,包含基因只有少数几个
CNV案例1:CNV影响肿瘤免疫治疗(Science)
文章发现细胞分化主要与Focal CNV有关,表示无限增殖与特定基因相关。然而,免疫应答逃脱与arm-level CNV有关,提示免疫逃逸与大量基因数目失衡有关。
CNV案例2:结直肠癌肿瘤异质性驱动事件研究——CNV的重要性
肿瘤间异质性(inter-):CRC的原发瘤和转移瘤间的SNV一致,但CNV不一致。
肿瘤内异质性(intra-): 一个CRC肿瘤内的高频突变找到P53和APC两个基因的SNV分布一致。但高频CNV找到的多个候选突变基因的CNV分布不一致。
CNV案例3:食管鳞癌机理研究
a. 利用704例测序数据,通过高频突变分析,发现20个候选驱动基因(出现在93%的样本中),其中MIL12等12个驱动基因已被证实。两个新发现的CUL3和RBPJ与肿瘤相关(+湿实验:敲除实验验证)
b. 97%样本出现CNV,发现57个高频CNV。这些高频CNV包含的基因30%与癌症有关,作者通过功能筛选,发现EGFR、BRD9等6个基因与肿瘤有关。
总结驱动基因相关文章思路: