人工智能可以“读取”你的大脑了

医疗产业 来源: DeepTech深科技、新智元 时间:2019-04-26 14:45 阅读(690)

许多患有神经疾病的患者因丧失语言能力,需要依赖特定的通讯设备进行沟通,这类设备利用脑机接口或者头部、眼睛的动作来控制光标选择字母,从而说出他们想说的话。但是,这个过程比人类的正常语速慢得多,往往是在蹦单词。


4 月 25 日,Nature 杂志发表了加州大学旧金山分校(University of California San Francisco)的一项最新成果,该校神经外科华裔教授 Edward Chang 及同事开发出一种可以将脑活动转化为语音的解码器。这套人类语音合成系统,通过解码与人类下颌、喉头、嘴唇和舌头动作相关的脑信号,并合成出受试者想要表达的语音。


视频 | 神经解码的语音合成演示(来源:UCSF Neurosurgery)



研究人员表示,脑机接口正迅速成为恢复功能丧失的临床可行手段,这项最新的研究成果解决了瘫痪和失语患者所面临的重大挑战,并可能是让他们恢复“说话”能力的重要一步。


在 Nature 杂志同时配发的评论文章中,埃默里大学和佐治亚理工学院的 Chethan Pandarinath 和 Yahia Ali 认为,这种使用控制嘴唇、舌头、喉部和下颌运动的神经信号合成语音的脑机接口设备,可以成为在失语者中恢复语音功能的奠基性工作。


解读大脑的意图


说话似乎是一件毫不费力的事,但实际上说话却是人类执行的最复杂的活动之一。它需要精确、动态地协调声道咬合结构中的肌肉、嘴唇、舌头、喉部和下颌。


当一个人因中风、肌萎缩侧索硬化(霍金即患此病)或其他神经系统疾病而丧失语言功能和沟通能力时,对他的影响和打击可能是毁灭性的。


如果有一种技术,能将神经活动转化为言语,那对于因神经损伤而无法沟通的人来说将具有变革性。理论上说,脑机接口技术可以通过直接从大脑“读取”人的意图,并使用该信息来控制外部设备或移动瘫痪的肢体,来帮助瘫痪的人完成说话或运动。


在科幻世界里,意念控制的实现可以顺手拈来、轻而易举。而在现实世界中,其背后的脑机接口技术已有近百年的历史。


科学家们也一直希望在该领域实现科学研究与应用技术的突破,为许多当前仍无法解答的难题提供更好的探索工具,帮助人类进一步了解自己的大脑,进而预防、诊断、治疗脑部疾病及其他重大疾病,并将这一技术广泛应用于睡眠管理、智能生活和残疾人康复等领域。


图 | 使用特制语音合成器的史蒂芬·霍金(来源:newzpole.com)


目前,一些用于大脑控制打字的脑机接口技术,依赖于测量头部或眼睛的残余非语言运动,或者依赖于控制光标以逐个选择字母并拼出单词,已经可以帮助瘫痪的人通过设备每分钟输出多达 8 个单词。


这些技术已经给有严重沟通障碍的患者带来了巨大的生活改善,但与自然语音每分钟 150 个单词的平均速度比起来,现有技术的输出速度还是太慢了,距离通过脑机接口实现自然语音的流畅交流还有很大差距。


直接通过大脑活动信号来合成语音,是一种颇有前景的替代方案。拼写只是离散字母的连续串联,而语音则是一种高效的通信形式。


与基于拼写的方法相比,直接语音合成具有几个主要优点。