计算机科学应用于唇腭裂语音诊疗的研究进展

2023年6月7日 口腔疾病防治
    语音治疗是唇腭裂综合序列治疗的重要组成部分,基于音标的主观语音评价被认为是腭裂语音治疗的“金标准”。主观语音评价是通过专业人员主观判听来判断语音清晰度和发音错误类型的测试,需要专业团队实施,存在易受环境干扰和个体偏差影响等局限性。
    利用仪器进行检查分析的客观语音评价能对主观评价进一步佐证与补充,常用方法包括X 线片、鼻咽内窥镜、语音频谱分析仪等,但无法避免空间限制、侵入性等问题。近年来,计算机语音处理系统和频谱分析逐渐被应用到唇腭裂语音评价中,其具有简单、无创、不受年龄限制等优势,可弥补传统主观和客观评价的不足。笔者就计算机科学在腭裂语音识别、分析和治疗方面的研究现状进行综述,为临床腭裂语音治疗提供研究思路。
    1.在线语音治疗平台
    唇腭裂语音治疗作为一种长期随访的持续性治疗,无需过多的辅助设备支持,因此可以适应在线智能平台诊疗的模式。国外已有基于物联网(The internet of things,IOT)架构的远程语音治疗平台用于评估病理语音,APLo、SpeakGeek等系统在初步使用中均卓有成效。
    在线平台能够使医患双方进行便捷的实时交互,保证医生密切掌握患者治疗进度,以便制定个体精准、适应患者身心发育的治疗计划。我国的唇腭裂语音治疗尚未有大范围的远程在线治疗实施,医疗资源紧张、专业化团队缺乏、高精尖技术欠缺都是亟待解决的因素,并且当下在线医疗尚处于发展阶段,其知名度与认可度仍有待提高。
    在线唇腭裂语音治疗要求高质量的语音传输来保证主观评价的准确性,需克服手持式电子设备计算能力有限的问题,目前已有较为成熟的自适应模型来更好地使语音特征序列与单词网络对齐。包括科大讯飞等在内的科技公司对移动终端处理能力的提升已有相当的进展,硬件条件基本满足语音治疗的使用需求。
    2.智能腭裂语音识别
    以人工智能媒介进行唇腭裂语音治疗的基础是通过语音信号处理和模式建立让计算机自动识别和分析患者语音特征。这避免了个体听力敏感度和倾向性对评价结果造成的系统误差,也减少了主观语音评价专业化学习及培训的难度。
    在医疗领域,已有研究发现人工智能对于自闭症谱系障碍患者的语音分析优于语音治疗师的主观判断,其能够降低结果的假阳性率与假阴性率;而结合多种语音信号特征或建立语音障碍数据库的人工智能分析已能在多种不同的环境下较为精确地分辨帕金森病症语音。
    近年来,针对高鼻音、咽擦音、声门塞音等腭裂语音中特征性代偿发音错误的针对性研究也逐渐增多,其识别分析技术已有较为成熟的结果。辅音省略是最典型、最常见的代偿性发音,使用机械设备克服病理性语音数据采集困难的客观条件,并通过波形差分析方法可以达成对辅音省略88.9%的准确检测;通过听觉滤波器和多通道模型相结合的方法能够对咽擦音的频谱特征进行提取并增强,使自动检测能够实现高达94.95%的正确率;除此之外,利用1/3倍频程算法提取特征谱线的技术也可以实现咽擦音与正常擦音的自动分类检测;而将声门塞音的多种声学特征参数结合识别的检测系统可以达到90%的信息熵正确率。
    结合以上研究,不难发现硬件和软件的进步和优化都是腭裂语音识别技术逐步成熟的重要基石。由于单一声学参数的使用在普遍评价上易出现系统偏差,对于各种代偿性发音不同侧重的谱系剖析也能使自动识别的准确性和特征性不断提高。同时,相较主观评价仅能通过增加检验人员数量或是重复测评来避免差错而言,借助智能语音识别能够从切分算法、能量分布、物理收音等多角度来保证和提高判断评价的准确性,这是精准医疗所必须的。
    目前对于腭裂语音识别方面的研究大多仅局限于独立的声学特征辨别,且没有大规模应用于临床的报道出现,综合多参数建立判别函数并结合前沿硬件设施的识别系统可能是打破这一瓶颈的研究方向之一。
    3.人工智能与言语障碍诊疗
    物联网和涉及智能设备的人工智能平台在言语障碍等疾病方面已有了初步尝试,已有研究证明此类治疗方式有助于患者临床症状的改善。从广义上划分,唇腭裂也属于器质性的言语障碍,可以尝试借鉴此类治疗模式。
    例如,在言语失用症领域,人工智能可辅助检测患者嘴部姿势来协助治疗人员进行语言康复训练,使医生能够同期对多位患者进行治疗,从而提高临床效率;基于个人移动终端的治疗应用程序在初步临床试验中也已证明对慢性表达性失语症有益,这些运用人工智能辅助治疗的案例对唇腭裂语音治疗的程序开发有极大的参考意义。
    不难发现,尽管未有国际通用的治疗软件推行,但人工智能在言语障碍领域已有初步的临床使用,其在易用性、依从性、普适性、准确性及治疗效率上均有优势。结合目前已有的唇腭裂语音识别进展,人工智能技术结合主观评价的腭裂语音治疗模式应当是切实可行的,该治疗模式可以提供更频繁和更有针对性的方案,辅之以语音生成的视觉交互,视听结合的治疗模式对于患儿而言更符合其知识摄取的客观需求,大大提高交互效率。
    唇腭裂对患者在情绪表达、幸福指数、环境适应能力上均有不同程度的影响,患者在接受语音治疗时正处于心智成熟和建立价值观的关键时期,接受器质性治疗的同时心理治疗也不容忽视。目前以人工智能为基础的社交机器人对于自闭症儿童言语表达上的治疗有较多临床研究支持,其外观及治疗形式相比传统治疗而言能显著减低患儿的社交焦虑并提高自我表达的积极性,从而提升治疗效果。
    完善的智能治疗平台能涵盖教学功能、激励特征和定量特征功能,可在没有医务工作人员的情况下用于全局评估,从而促进治疗效率的提高和合理的医疗资源分配,有助于唇腭裂综合序列治疗的多地域普遍开展。
    4.展望
    目前,计算机科学在唇腭裂语音评价及治疗方面尚未出台具体治疗方案和治疗规范,与主观评价结合的治疗模式也有待进一步临床试验后进行补充完善。但从言语障碍领域的应用来看,其对于患儿年龄和术后时间点的要求相比常规治疗无显著差异,因此可沿用目前广泛认可的序列治疗时间线。
    同时,在主观评价中,噪声干扰的影响是致命性的,人工智能可以通过优化算法或是增设滤波设备来消除混响,减少残留噪声,增强识别精度,降低环境要求;柔性压电声学传感器等最新设备的推出在语音接收和分析方面已有了接近甚至超越人耳的潜质,加之以当下普及的各类移动终端设备,其治疗模式已没有明显的硬件设备障碍;深度神经网络的出现确保人工智能能够进行自我补足与完善。
    因此就发展潜力而言,基于计算机科学的唇腭裂语音评价与治疗体系是超越传统主观评价模式的。由于尚无具体临床案例治疗效果的参考,计算机科学辅助的语音治疗模式在实施过程中也可能遭遇尚未发现的障碍。远程在线平台在目前唇腭裂综合序列治疗中亦未获得较高水平的开发和使用,除了软硬件条件限制之外,临床医生、研究人员以及计算机工程师三者之间合作有限,无法进行细致的交流反馈从而进行共同开发也是阻碍因素之一。应当大力推动医工交叉项目的落实与研究,促进科研成果的临床转化。
    5.总结
    计算机科学在唇腭裂语音治疗领域的使用是客观需要和未来发展的双重要求,基于智能平台的语音治疗可以成为唇腭裂患者语音治疗的有效辅助手段,灵活运用人工智能媒介与主观评价体系的结合是唇腭裂综合序列治疗的前景模式之一。智能唇腭裂语音识别已有一定的研究基础和进展,但目前尚未应用于临床。未来研究方向可着眼于高效精准的语音识别和能够自我学习完善的人工智能治疗程序,依托于医工交叉项目实现人工智能在唇腭裂语音治疗领域的成果转化。
阅读原文阅读  10681 投诉
写留言