基于深度学习的口腔癌预后分析

2023-1-17 16:01 来源：口腔疾病防治
作者：陶谦袁哲阅读量：12722

诊疗技术日新月异，随之而来的是数量巨大的医疗信息，以往常用的资料分析模型已不能满足数据处理分析要求。人工智能（artificial intelligence，AI）提供了一种高效处理大量数据的方法，随后演化出的机器学习（machine learning，ML）从中进一步优化运算模式，提高了结果的可靠度，深度学习则脱胎于机器学习，能够实现对更复杂、抽象信息的准确提取与利用。
深度学习拥有模仿人类大脑生物神经的数据处理架构，具备高效分析多类型、多批次数据的能力，提供了一种更具智慧的计算思路。其最大优势在于可以通过自我运算，调整各组数据的权重，以获得更优的输出结果，这种结果的不断优化就是算法的“学习”过程，常用深度学习模型有误差反向传播（error back propagation，EBP）算法、卷积神经网络（convolution neural network，CNN）等。
深度学习在自动化驾驶、极端天气的预警和地震预测等日常生活相关领域中取得了令人鼓舞的成果，激励着医疗研究者将深度学习融合应用到专业性更强、情况更复杂的医学领域。在世界范围内，口腔癌是具有高发病率和高死亡率的恶性疾病之一，仅在2018年，185个国家口腔癌的新发病例超过35万，超过17万人因此死亡。
然而诊治技术的进步并未给患者的预后情况带来改观，根据美国国立卫生研究院（National Institutes of Health，NIH）的最新统计，口腔癌患者的5年生存率为66.9%，死亡率在过去10年间以每年0.5%的速度上升，迫切需要进一步深化预后研究。在口腔癌预后评估中，以临床病理资料为基础的分析方式受到广泛认可，却存在数据来源单一、算法分析能力不足等局限，深度学习有望破解当前预测患者生存信息过程中面临的困境。
1.深度学习在医学领域应用举例
医疗数据的快速增长与形式多样化给临床诊疗工作带来了挑战，在日常诊断中，影像医师常常需要在日均8h的工作中每3～4秒阅读一张影像，方有可能满足工作需求，由于审阅过程主要依靠人工识别与判断，在高强度和长时间的工作状态下，遗漏和错误将难以避免。
深度学习具备高效处理海量数据的能力，对输出结果可自动纠错和优化，这种更高效“人脑化”的人工智能具有广阔的应用前景，已在临床诊疗工作中产生了积极作用。Diller等进行了一项由10019名受试者参加的研究，应用卷积神经网络来评估先天性心脏病患者预后状况，结果显示超过90%的患者得到了准确的疾病分类，为后续治疗提供了可靠保障。
在眼科疾病诊疗中，深度学习能做到快速、准确地识别并分类检查图像，Kermany等基于深度学习模型InceptionV3，对4686例患者的光学相干断层扫描（optical coherence tomography，OCT）图像进行诊断与预测训练，诊断准确率达到96.6%；此外，针对识别出的可能致盲性疾病的图像，如脉络膜新生血管和糖尿病黄斑水肿，模型会对接诊医生发出警报，并辅助制定治疗方案。
针对消化系统疾病，卷积神经网络实现了胃部幽门螺杆菌携带者的100%正确识别，模型能纠正人工病理审阅造成的误诊，有望辅助临床医师完成胃内幽门螺杆菌携带者的筛查、诊断工作。
2.深度学习与癌症
对癌症的早期明确诊断和准确判断预后，是医务工作者亟需解决的难题。深度学习可以为临床医师在癌症筛查、诊治与转归等方面提供可靠且高效的方法学帮助。
2.1癌症诊断
深度学习通过对癌症患者的现有影像学资料进行智能化分析，挖掘并解读蕴藏在影像图片中的高价值信息，可以有效避免漏诊甚至误诊，弥补了人工的局限性。肺部CT是肺癌筛查和早期诊断的重要手段，然而CT提示的不确定肺结节（indeterminate pulmonary nodules，IPNs）存在图像信息集成度高、结节影的多样化表现等特点，人工审阅难以做到准确分辨良、恶性。
而利用卷积神经网络回顾性分析IPNs患者CT影像资料，可以构建出肺癌预测-卷积神经网络（lung cancer prediction convolutional neural network，LCP-CNN）模型，对CT数据进行自动分析，判断肺结节良、恶性以及做出恶性肺结节的分级，后续的前瞻性研究证明LCP-CNN模型诊断的精确度和可靠度均高于对照组的logistic回归模型。
2.2癌症预后分析
在癌症患者的预后评估中，目前常用方法大多是基于TNM分期信息与比例风险回归模型（pro-portional hazards model）（又称COX回归模型）、随机森林（random forest）等算法模型构成。TNM分期侧重的病理指标有限且不够细化，传统预测模型无法有效纳入分子生物学等学科产生的大容量、高度集成化信息，深度学习可实现不同类型（病理、影像和基因）、不同形式（图像和文本）的资料综合运用分析。
She等比较了DeepSurv与TNM2种模型对非小细胞肺癌患者的预后预测效能，DeepSurv发挥数据融合能力，纳入了人口学、病理学和所用治疗方式等127项疾病信息，在患者病情分级及预后评估中显示出强大的优势。
Skrede等运用DoMorev1神经网络模型，对1200万张存在预后差异的结直肠癌患者病理图像进行分析，结果提示结直肠癌患者的淋巴结转移、淋巴管和血管浸润情况与患者的预后存在显著关联，并在验证阶段取得了良好效果。
Chaudhary等运用支持向量机（support vector machine，SVM）分析肝癌患者的3类组学特征，结果提示频繁的TP53（tumorproteinp53）突变以及角蛋白19（keratin19，KRT19）、上皮细胞黏附分子（epithelial cell adhesion molecule，EPCAM）、杆状病毒凋亡抑制蛋白重复序列蛋白5（baculoviral inhibitor of apoptosis protein repeat-containing protein 5，BIRC5）等标志物的高表达反映出较差的预后情况。
3.深度学习与口腔癌预后分析
大多数口腔癌的发生部位较表浅，易于发现，通过患者临床症状结合影像学与组织病理学等检查方法使得确诊过程并不复杂。肿瘤范围与大小、侵袭深度、淋巴结受累和肿瘤切除边缘干净与否等临床病理因素被认为和预后密切相关。
在口腔癌治疗方面，尽管以综合序列为基础的个性化治疗手段日益多样，但是口腔癌患者的总体疗效仍不容乐观。口腔癌患者的预后情况与患者自身疾病状态和临床医师施行的治疗措施密不可分，从中分析、筛选影响患者生存的各种因素，对提高患者的生存质量十分重要。
3.1组织病理学
组织病理学检测不仅是诊断口腔癌的金标准，也是预测患者生存的重要指标，TNM分期是目前最常用的预后评估依据，它在很大程度上需要依赖病理学资料支持。Zanoni等在1985—2015年间跟踪了2082例口腔癌患者的生存情况，基于COX回归模型研究预后影响因素，除T分期、N分期和M分期以外，神经侵犯、血管侵犯及肿瘤切缘癌细胞情况等病理指标是影响患者生存的独立影响因素；此外，Heikkinen团队与Spector团队分别分析了308例和464例口腔癌患者，一致认为肿瘤浸润淋巴细胞（tumour infiltrating lymphocytes，TIL）程度是另一影响预后的病理因素。
近年来随着生物信息学等新兴学科的发展，反映口腔癌患者的预后指标日益丰富，迫切需要以深度学习为代表的智能化分析方法实现对预后信息的全面纳入、深度探索与合理利用。深度学习在对口腔癌患者病理数据的分析与利用方面已初露成效。深度学习与光学显微镜相结合推出的深度学习扩展景深（deep learning extended depth-of-field，DeepDOF）显微镜，优化了普通光学显微镜的分辨能力，能够观察到更加精细的口腔癌病理学改变，如细胞核形态的细微变化、血管腔的改变等，可有效预测患者治疗后的复发风险。
Kim等运用DeepSurv模型回顾性分析255例口腔鳞癌患者的预后情况，将T分期、N分期、癌细胞分化程度等8项病理学指标和复发情况作为预测变量引入DeepSurv，引用c指数来反映模型的预测准确性，结果显示DeepSurv的准确性得分最高，为0.810，而对照组中随机森林图的c指数为0.770，COX比例风险模型得分为0.756。
TIL程度较高被认为是提示口腔癌患者良好预后的一个指标，通过MobileNet模型识别口腔癌患者的病理图像，判定肿瘤细胞、淋巴细胞、基质与伪影四类区域，MobileNet的准确分辨率为96.31%，据此建立的TILAb（TILAbundance）评分为预后评估提供了可靠保证。
3.2影像学
口腔癌患者的影像学资料对评估病灶范围、颈部淋巴结情况等关键预后指标具有重要参考价值。将舌癌患者放射治疗前的CT特征信息输入基于BP算法构建的预测模型（probabilistic genetic algorithm-back propagation，PGA-BP），得到患者的生存时间为（31.6±15.8）个月，接近（30.5±21.3）个月的实际值，进一步分析生存期长组、生存期短组患者间图像，模型识别出F5-灰度协调矩阵（gray level coocrrencr matrix，GLCM）3（7-1相关）、F5-GL-CM3（12-1相关）、F5-GLCM3（6-1相关）等12个差异信号。
Fujima等利用口腔癌患者的正电子发射断层扫描（positron emission tomography/computed tomography，PET/CT）图像，基于深度学习模型ResNet-101评估口腔癌患者的无病生存期（disease-free survival，DFS），在验证队列中的评估准确率达到80%。
口腔癌患者颈部淋巴结转移与淋巴结外侵犯（external nodal extension，ENE）对患者评估预后具有参考价值，深度学习模型DetectNet研究了56例口腔癌患者的CT图像，8s完成1次分析，对颈淋巴结转移的识别准确率达到90%；利用卷积神经网络分析51例口腔癌患者的CT图像以评估淋巴结外侵犯情况，模型实现了84%的准确识别率，高于人工组62.6%的最优结果。
3.3分子图像
新近发展的分子图像在口腔癌诊疗工作中的作用也愈加重要，信号表达、基因调控等情况可反映患者的预后信息。2011年，Hanahan等从微环境层面总结出癌症的特征，包括能量代谢重组、避免免疫破坏、抵抗细胞死亡等8个方面，Sasahira等据此归纳出维持增殖、逃避生长抑制、促进炎性反应等10类反映口腔癌预后的传统信号，并进一步整理出转运和高尔基组织蛋白1（transport and Golgi organization protein 1，TANGO1）、苹果酸酶1（malic enzyme 1，ME1）、叉头框蛋白C2（fork-head box protein C2，FOXC2）等11个新预测指标的升高与miR-126的下降均提示不良预后，但这些数据多以抽象的图像形式表达，不利于解读与使用。
Kim等从癌症基因组图谱（the cancer genome atlas，TCGA）与国际癌症基因组联盟（International Cancer Genome Consortium，ICGC）中获取了173例口腔癌患者RNA测序数据和免疫细胞信息，通过估计RNA转录本的相对亚群来鉴定细胞类型（cell-type identification by estimating relative subsets of RNA transcripts，CIBERSORT）与聚类分析将患者分为高风险组与低风险组，之后利用Mann-WhitneyU检验确定了幼稚B细胞、记忆B细胞、T细胞CD8等16种存在组间丰度差异的免疫细胞，并进一步区别出小脯氨酸蛋白3（small proline-rich protein 3，SPRR3）、Ⅺ-α-型胶原链（collagen typeⅪ alpha 1 chain，COL11A1）、X-α-型胶原链（collagen type X alpha 1 chain，COL10A1）等7类标记基因。
通过TensorFlow中的深度学习模块分析患者的上述预后指标以评估生存情况，模型的评估准确率为97.2%。3.4放化疗尽管以放疗、化疗为主的综合序列方式日渐丰富，但不少患者的预后情况并未因此改善，提示医师要根据患者病情合理地选择治疗方法。
Howard等运用DeepSurv、随机生存模型（random survival forest，RSF）和神经多任务logistic回归（neural multitask logistic regression，N-MTLR）等3种深度学习模型，回顾33527例口腔癌术后患者后续放疗或放化疗的获益情况。模型筛选出患者预期寿命、淋巴结转移数目、肿瘤T4阶段与人乳头状瘤病毒（human papillomavirus，HPV）阳性等因素，这些因素对放疗和（或）化疗的选择具有参考意义，DeepSurv与N-MTLR据此拟定的治疗方案能够有效延长患者的生存时间；此外，对于被建议仅接受放疗的患者，3个模型均显示增加化疗并不能显著改善患者的预后。
Li等基于PyraNet与DenseNet模型开发出条件生成对抗网络（conditional generative adversarial network，cGAN），分析231例口腔癌患者的CT图像，评估不同风险器官（organs at risk，OAR）所需接受的放射剂量，相比于对照组-商业计划治疗系统（treatment planning system，TPS），cGAN实现了快速、精准量化每一区域或器官应接受的放射剂量，有望辅助临床医师为患者提供个性化的放疗方案。
4.小结
深度学习在评估口腔癌患者预后过程中展现出卓越效能，不仅能够开发临床医师肉眼直视下难以发现的病理学与放射影像学信息，提升资料的应用价值；又能有效融入分子医学领域，充分发挥出数据的预测作用。与此同时，深度学习模型辅助下制定的治疗方案对口腔癌患生存时间的提高显示出积极效果。但深度学习在许多方面都不同于人类智能，临床上存在缺乏前瞻性研究、单中心数据规模小等系统性局限，目前应适度参考其运算结果，期待今后深度学习能够逐步运用到现实的临床工作中，辅助医师对口腔癌患者病情作出精准判断与治疗，造福于患者。

编辑：陆美凤

基于深度学习的口腔癌预后分析

网友评论