香港东华学院Ellie Chu团队旨在开发一种AI系统,通过纹理分析来辅助病理学家诊断GBM,并通过当地临床数据进一步验证该系统。文章发表在2023年10月的《Cancers》。
——摘自文章章节
【REF: Cheung EYW, Wu RWK, Li ASM, Chu ESM. Cancers (Basel). 2023;15(20):5063. Published 2023 Oct 19. doi:10.3390/cancers15205063】
研究背景
GBM是最常见的恶性原发性脑肿瘤之一,占所有胶质瘤的60-70%,被世界卫生组织(WHO)根据组织病理学特征分类为IV级肿瘤。其侵袭性和高血管生成特性导致它在脑实质内扩散,从而导致高复发率和不良预后。早期诊断和有效治疗规划对于提高患者的生存率至关重要。与显示肿瘤位置和大小的影像学成像不同,组织病理学图像为癌症诊断提供了更重要的依据。该研究中,通过对癌细胞形态(如细胞和组织中成分的形状、大小和结构)进行研究,并与正常细胞和组织进行比较,进行了详细的形态学分析。此外,研究还利用了基于纹理的图像分析方法,如灰度共生矩阵(GLCM)和灰度游程长度矩阵(GLRLM),这些方法提供了与传统一阶统计分析相比更全面的组织病理学图像分析。同时,为了有效处理大量图像特征,研究还探讨了机器学习在癌症诊断中的应用,包括器官分割、医学图像的多模式配准,以及使用CT或MRI图像的计算机辅助癌症诊断。为此,香港东华学院Ellie Chu团队旨在开发一种AI系统,通过纹理分析来辅助病理学家诊断GBM,并通过当地临床数据进一步验证该系统。文章发表在2023年10月的《Cancers》。
研究方法
本研究使用了两个数据集,一个是癌症基因组图谱中的胶质母细胞瘤收集(TCGA-GBM),包括262名参与者的组织病理切片、CT图像、MR图像和临床数据。另一个数据集来自香港一家医院,包括60名被诊断为GBM的患者和60名无脑肿瘤病史的正常对照组的病理切片。
研究中对这些常规染色组织切片进行了数字化处理,并进行了预处理,包括染色和白平衡标准化,以标准化收集的图像特征。接着,从这些图像中提取了22种灰度共生矩阵(GLCM)特征和11种灰度游程长度矩阵(GLRLM)特征。
研究的流程包括两个部分:第一部分使用五种机器学习算法(决策树、极端增强、支持向量机、随机森林和线性模型)构建GBM诊断模型;第二部分使用本地医院的独立组织病理学图像来部署这些模型,验证模型是否能准确诊断GBM。此外,还进行了十折交叉验证以最小化过拟合,并使用总体准确度、敏感性、特异性和接收者操作特征(ROC)曲线下面积来评估五种机器学习算法的性能。最后,使用本地数据对构建的模型进行了部署验证。
研究结果
本研究包括来自TCGA GBM数据集的262名患者和来自香港一家本地医院的60名患者。在33种图像特征中,共有15种特征被证实在区分正常组织和GBM组织方面表现良好。在GLCM特征中,包括对比度、差异方差、不相似度、能量、熵、均匀性、最大概率、总平均、总熵、差异熵、相关性信息测量、反差归一化和反差矩归一化等12种特征。在GLRLM特征中,有灰度非均匀性、低灰度重点强调和长游程低灰度强调等3种特征。自相关是衡量与图像纹理相关的指标,反映了图像的细腻度和粗糙度。正常组的自相关数值范围较小,表明图像细节更加细腻。GLRLM评估具有相同灰度的像素连续序列的长度。灰度非均匀性衡量图像中灰度强度的相似性,低灰度重点强调和长游程低灰度强调分别测量图像中低灰度值的分布和连续序列长度。通过使用来自TCGA-GBM患者和正常人群的1500张图像,构建的五种机器学习模型(决策树、极端增强、支持向量机、随机森林和线性模型)在训练和验证阶段表现出100%的准确性、敏感性和特异性。交叉验证的结果也显示了这些模型的鲁棒性。ROC曲线分析和混淆矩阵表明这些模型在GBM诊断中的有效性。在五种模型中,支持向量机(SVM)模型在本地医院数据集的GBM诊断中表现最佳,总体准确率达到93.5%,敏感性为86.95%,特异性为99.73%。其他四种模型在GBM诊断中的表现较差,准确率仅为55.0-60.3%,主要问题是敏感性表现较差,仅为0-20.8%。此外,SVM模型的准确率在统计上显著优于其他模型(p<0.05),进一步证实了SVM模型在GBM诊断中的优越性和潜在的临床应用价值。
研究结论
综上所述,本研究确定了12种GLCM和3种GLRLM纹理特征,适用于GBM诊断。这些特征可用于基于AI的组织病理学图像分析。在开发的AI模型中,SVM模型准确率最高,达到93.5%,灵敏度为86.95%,特异性为99.73%,显示出在未来临床应用中的巨大潜力。
声明:脑医汇旗下神外资讯、神介资讯、神内资讯、脑医咨询、AiBrain 所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。