图片来自pixabay.com
当地时间7月15日,美国加州大学旧金山分校的研究人员在《新英格兰医学杂志》上发表论文称,他们开发出了一种“神经假肢”,可以将控制声道的大脑信号直接转换成屏幕上的文字,从而帮助因严重瘫痪而失语的病人用句子进行交流。
“这是首次从失语患者的大脑活动中直接解码出完整的单词,显示了利用大脑的自然语言机制来恢复交流的强大前景。”论文通讯作者、加州大学旧金山分校神经外科的Edward Chang说。新研究利用了语言自然流畅的特性,直接翻译控制发声系统肌肉的信号,保证了更快速、省力的交流。Chang说:“我们能够以每分钟150~200个单词的速度交流信息,而打字、书写和控制光标的拼写方式不仅慢得多,也更加费力。”
在过去的十年里,Chang分析了具有正常语言能力的志愿者大脑中与语言相关的活动。随后,研究人员绘制了与声道运动相关的皮质活动模式。为了将这些发现转化为完整单词的语音识别,论文第一作者David Moses博士开发了实时解码这些模式的新方法,并结合统计语言模型提高了准确性。
然而,这些还不够,科学家们此时并不能保证该技术在声带瘫痪病人的身上也能起作用。“我们的模型需要学习复杂的大脑活动模式和有意义语言之间的映射,当患者不能说话时,这就构成了一个重大挑战。”Moses说。此外,对于那些多年无法活动发声肌肉的人而言,控制声道的大脑信号是否仍然完整也未可知。
为了研究新技术在瘫痪人群中的潜力,Chang等人开展了一项名为“BRAVO”(手臂和声音的脑-机接口恢复)的研究。首位参与者BRAVO1是一名40多岁的男子,他在15年前因脑干中风而丧失了语言能力。Chang通过手术将高密度电极阵列植入BRAVO1的语言运动皮层,并记录了该区域22小时的神经活动。当BRAVO1试着多次说出测试前确定的50个单词时,电极会记录来自语言皮层的大脑信号。研究人员使用自定义的神经网络模型,将记录下来的神经活动模式翻译成特定的文字。最终结果显示,结合新技术的模型能够快速解码大脑活动的单词,准确率高达93%,这得益于其自动更正功能。
Moses将早期的试验结果描述为概念验证。他说:“看到了各种有意义语句的准确解码,我们很兴奋,这说明用新方式促进交流是可行的,而且该方式在对话场合中也有应用潜力。对于不能自然交流的人来说,这是一个重要的技术里程碑。”
科界原创
编译:花花审稿:西莫 责编:陈之涵
期刊来源:《新英格兰医学杂志》
期刊编号:0028-4793
原文链接:https://www.eurekalert.org/pub_releases/2021-07/uoc--rw070921.php
版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家—科界App。