深度学习生存预测模型探索了与GBM干细胞、耐受性基因密切相关的基因,可用于指导患者的治疗。与传统的Cox比例风险生存模型相比,即使已有强大的临床预测指标,深度学习也能为患者的生存预后提供高效有意义的预测价值。这些基因可能是潜在的生物标志物或治疗靶点。
——摘自文章章节
【Ref: Wong KK, et al. Cancers (Basel). 2019 Jan 8;11(1). pii: E53. doi: 10.3390/cancers11010053】
研究背景
基于深度学习(Deep learning)的大数据分析有助于从大型数据库中筛选与预后相关的基因,预测药物协同作用,预测存活率等,近年来得到广泛关注。深度学习提供了模拟大量差异基因表达的能力,不易受多重共线性的影响,更好地概括数据特征。基于转录组数据的深度学习最近才用于确定影响GBM或其他癌症预后相关基因的特征。美国休斯顿卫理公会研究所的Wong KK等人在GBM相关数据库中,通过研究训练有素的深度学习模型,以发现GBM的预后相关基因特征。文章在线发表于2019年1月《Cancers》杂志。
研究方法
通过TCGA挖掘初诊为GBM,经历标准化治疗(手术/化疗)后的患者中具有预后价值的基因。研究者将GBM基因表达数据作为构建深层多层感知器神经网络的输入数据,以似然函数作为损失函数来预测患者生存风险,通过输入置换方法识别对模型重要的基因。除了临床、基因突变和甲基化因素之外,单变量、多变量Cox生存回归也用于评估深度学习特征的预测价值。同时将深度学习对GBM的预测价值与其他机器学习:岭回归、Lasso回归和ElasticNet回归等进行了比较。最后通过深度学习提取了27个深度学习特征来预测总体生存。
研究结果
研究首先以p<0.01为界值,从27种模型中筛选出39条基因(如下表所示)。
在10个胶质瘤相关数据库中进行验证,发现这一组基因能够显著将胶质瘤患者分为高危与低危组。
图1. Kaplan-Meier法进行生存分析,生存时间(月):来自7个胶质母细胞瘤和3个低级别胶质瘤研究数据中的前39个基因将低风险(绿色),高风险(红色)患者群体,有效地分开。
其中10条基因与GBM干细胞、干细胞微环境和治疗耐受机制有关,这些基因分别是:POSTN、TNR、BCAN、GAD1、TMSB15B、SCG3、PLA2G2A、NNMT、CHI3L1和ELAVL4。
结论
深度学习生存预测模型探索了与GBM干细胞、耐受性基因密切相关的基因,可用于指导患者的治疗。与传统的Cox比例风险生存模型相比,即使已有强大的临床预测指标,深度学习也能为患者的生存预后提供高效有意义的预测价值。这些基因可能是潜在的生物标志物或治疗靶点。