025-82224512
当前位置:资讯中心 新闻详情
失语者的“新声”,BCI+AI创造“神话”
2024/04/29

科技进步是为了反哺人类“进化”,近年来随着脑机接口和人工智能等技术的发展,越来越多的研究团队致力于用先进的成果去帮助需要的人群,其中对于帮助失语者重获“新声”取得一定的突破,为聋哑人士与外界沟通提供了新途径。


脑机接口技术能够解析与语言生成相关的大脑区域活动,如运动皮层和语言中枢,并将这些信号转换为文字或语音。加上人工智能的辅助,甚至可以预测“说话”者的下一步意图,提高交流效率。


 图片1.png


另一方面,也可以训练人工智能理解手语,在与普通人进行沟通时作为实时翻译。


发表在《Nature》上的一项研究结果表明,斯坦福大学的研究团队开发的一个皮质内脑机接口系统,能够以每分钟62个词的速度将患者的思维转换为语言,这一速度是之前技术的3.4倍,与正常人的输出速度差别已经逐渐缩小。


此外,加利福尼亚大学旧金山分校的研究者也取得了突破,他们利用更少的大脑神经元信号,通过深度学习模型,能够将其转化为文字、语音,甚至是动画头像的面部表情,准确率高达73%,并可以逐渐提高到90%以上,为失语者提供了更丰富多元的沟通方式,也为脑机接口的研发打开了新的思路,展现出技术进步的强大应用价值。


图片2.png 


今年OpenAI的音频模型Voice Engine,实现了可以根据15秒参考声音生成高清晰度、连贯性强、音色自然的音频;该技术可应用于多个领域,例如与脑机接口结合帮助失去语言能力的人恢复发音、儿童教育有声读物生成、多语言视频翻译等。


国内的研究团队同样在帮助失语者发声方面成果显著,清华大学研究团队选用石墨烯设计了一套纳米传感结构,能够感知到力的极微小变化,精准检测到喉部的微弱肌肉运动以及和发声相关的振动,再通过技术手段将这些微弱的振动还原为声音。

图片3.png 


去年该团队邀请知名商务人士蔡磊试用此系统,研发人员对蔡磊喉咙处的肌肉、皮肤振动情况进行采集,并分析振动情况。为还原健康时的语音特点,研发团队收集大量的蔡磊过去的视频和音频素材,对声音特征分析和建模,然后用语音合成模型生成接近他原有声音的语音信号,人工喉咙因此能够发出他健康时的声音。


据了解,在一定条件下此人工喉咙可以实现九成以上的准确率。而我们在实际交流中,一般达到七八成的识别准确率就可以满足日常需求。研发团队表示,他们通过更丰富的数据积累和研究,提升了人工喉咙的语音合成质量,并在此过程中着力于降低人工喉咙的功耗、成本。未来团队将努力让人工喉咙适应不同语言和方言背景的人群,能够表达不同的情感和语气,能够与其他智能设备和平台互联互通。


相比较传统的手语沟通,这些方式更直接、可触达人群也更广,与此同时降低了双方的沟通交流门槛,帮助有表达障碍的人更好地提高生活质量、融入社会。


当然,不论什么技术的发展都应当以人为本,相关伦理道德等问题一直是脑机接口技术研究同时应当格外关注的重点;并且技术不音局限在实现更深层次的脑活动解码,帮助失语者和聋哑人士更好地与外界沟通,还可以扩展到认知增强、虚拟现实等领域,为人类开启认识世界的全新方式。


图片4.png 


我们相信随着技术的不断进步和群众的接受程度提高,脑机接口将在更多的生活场景中为失语人群表达他们的心声,拉近人与人直接的距离。