加州大学重磅技术成果 利用AI技术首次实现无声带讲话功能 准确度94.68%

机器人2024-03-223728医疗机器人人工智能(AI)

对于声带病变和喉癌手术恢复期患者来讲,通过声带讲话是一件非常困难的事情,科学家们一直都在探索帮助患者突破发声困难和失声的问题。近日加州大学公布的一项重磅成果,借助喉部肌肉震动成功转化为声音信号,实现了患者术后发声需要。 


 

可穿戴传感-执行系统的设计 


 

加州大学洛杉矶分校工程师团队成功研发出一种柔软、轻薄、富有弹性的装置。该装置呈正方形排列,单边长度约为2.5cm,可贴合于喉咙外部皮肤之上,帮助声带功能障碍患者恢复发声功能。目前这一重要研究成果已在Nature Communications杂志上刊登。


 

▍新型材料将肌肉运动转化为声音 识别率接近95% 


 

新型生物电系统,由加州大学洛杉矶分校塞缪利工程学院生物工程助理教授陈俊及其研究团队共同研发,该系统能够检测人类喉部肌肉活动,并且在机器学习技术协助下,将运动信号转化为声音,识别精准度接近95%。 


 

加州大学洛杉矶分校塞缪尔利工程学院生物工程系的助理教授陈俊 


 

此前陈俊博士曾开发一种可穿戴手套,能够将手语动作直接翻译成英语语音,进而帮助手语使用者与非手语使用者之间进行顺畅沟通。


 

可穿戴传感-执行系统的性能特征 


 

这种新型微小的贴片式设备由两个部件组成。其中一个是自供电传感组件,用于检测肌肉运动产生的信号并将其转换为高保真、可分析的电信号,之后利用机器学习算法将这些电信号转换为语音信号。另一个是执行组件,将这些语音信号转化为声音表达出来。


 


 

这两个组件均由两层组成:一层是具有弹性的生物相容性硅化合物聚二甲基硅氧烷(PDMS),另一层是由铜感应线圈制成的磁感应层。夹在两个组件之间的是内含与微型磁铁混合的PDMS,能够产生磁场。


 

将喉部肌肉运动转换为可分析的电信号 


 

这种搭载软磁弹性传感机制的装置由陈俊团队2021年开发,能够监测因机械力导致的磁场变化。磁弹性层嵌入了蛇形感应线圈,有助于产生用于传感目的的高保真电信号。


 

该装置采用正方形结构设计,每个边长为2.5cm,重量约为7克,厚度仅为1.5mm,采用特制的双面生物兼容胶带,使其能够粘贴在人的喉咙靠近声带的位置,粘脱方便并且能够重复使用。


 

无需声带的机器学习辅助可穿戴式口语系统 


 

与传统的手持式喉电设备和气管食管穿刺手术不同,陈俊团队的软磁弹性传感机制能够消除因入侵治疗带来的不适感。是一种可穿戴,无创的辅助可穿戴设备,该设备的设计意义在于嗓音疾病治疗前和治疗后恢复期间帮助患者进行交流。


 

▍如何让AI技术提升识别率? 


 

为了验证AI技术对于声音的识别率,陈俊团队对八名健康测试者进行测试。研究人员收集了测试者喉部肌肉运动的数据,并使用AI技术,将产生的信号与某些单词相关联。然后,他们通过设备的驱动组件选择了相应的输出语音信号。在机器学习的帮助下,最终转化为可听声音,研究小组通过让测试者大声和无声地朗读五个句子,包括 "嗨,瑞秋,你今天好吗?"和 "我爱你!",来证明该系统的准确性。


 


 

研究团队进行反复测试,最终确定使用机器学习测试方法,能够达成94.68%成功率,经过致动组件的放大处理,这表明传感机制识别了他们的喉部运动信号,并与测试者希望说出的相应句子相匹配。


 

未来,研究团队将继续通过AI技术,扩大设备的词汇量,并有望在语言沟通障碍的人群中进行测试。这项研究得到了美国国立卫生研究院、美国海军研究办公室、美国心脏协会、大脑与行为研究基金会、加州大学洛杉矶分校临床与转化科学研究所以及加州大学洛杉矶分校塞缪利工程学院的资助。


 

相关资料:


 

可穿戴生物电子学研究小组:

https://www.junchenlab.com/

论文发表地址:

https://www.nature.com/articles/s41467-024-45915-7

陈俊实验室:

https://twitter.com/JunChenLab