来源:同济医院脑机接口研究院
时间:2025-12-01
浏览量:
分享:
近日,华中科技大学同济医学院附属同济医院神经外科舒凯教授团队与华中科技大学人工智能与自动化学院伍冬睿教授团队深度合作,在国际神经工程领域顶级期刊 《Journal of Neural Engineering》 上发表了基于脑磁图(MEG)的非侵入式中文语音解码的最新研究成果。
该研究首次提出了一种基于MEG的非侵入式中文语音解码新范式,成功建立了中文脑磁图(MEG)数据集,并通过跨模态知识辅助的人工智能算法,实现了对中文词汇的有效解码。这一成果标志着我国在非侵入式中文脑机接口领域迈出了坚实的一步,为未来帮助失语症患者重获“中国声音”带来新的可能。

(图 基于脑磁图(MEG)的非侵入式中文语音解码新方法)
一、 愿景:为“沉默的世界”寻找一把钥匙
据统计,我国现有数以百万计因脑卒中、渐冻症(ALS)等神经系统疾病导致言语功能障碍的患者。他们思维清晰,却身陷“沉默的牢笼”。如何让这些患者重新获得与外界沟通的能力,是医学界和工程界共同面临的重大挑战。
“传统脑机接口往往需要患者进行长时间的训练,且沟通效率有限。”同济医院脑机接口研究院副院长、神经外科主任舒凯教授表示,“我们追求的,是让机器直接读懂人大脑中的‘语音意念’,实现最自然的交流方式。”
为此,研究团队将目光投向了具有独特语音体系的中文。与拼音文字不同,中文复杂的声调系统、密切耦合的字形系统及其所依赖的广泛协同的脑网络对解码技术提出了极高要求。攻克这一难题,不仅具有重要的学术价值,更关乎我国特定人群的民生福祉。
二、 破局:以高分辨率MEG数据作为解码新工具
在技术路径的选择上,研究团队通过医工交叉联合攻关,展现出了极具前瞻性的战略布局。与目前主流非侵入式脑机接口普遍采用的脑电图(EEG)技术不同,该研究创新性地选用了脑磁图(MEG)这一高精度技术路线。
“如果说EEG是在听一场隔墙的模糊对话,那么MEG就如同拥有了一扇透明玻璃窗,能够更清晰地‘观察’到大脑语言网络的实时活动。”研究团队成员胡峰副教授形象地比喻道。据了解,本项目采用的是由北京未磁科技研发的国产高端医疗装备——原子磁力计脑磁图(OPM-MEG)。
MEG技术具备卓越的时间和空间分辨率,能无创检测大脑神经元活动产生的微弱磁信号,为解析复杂的中文语音神经编码机制提供了独特优势。基于此,团队构建了首个面向中文言语脑机接口的MEG数据集,包含48个覆盖日常交流和医疗场景的高频词汇,填补了该领域的数据空白,旨在推动后续算法基准的建立。
三、 创新:“双顾问”机制赋能AI读懂潜台词
如何从海量、复杂的脑磁信号中提取出有效的语言特征?研究团队的核心创新在于提出了多模态辅助言语解码算法(MASD)。
该算法创造性地引入“文本”与“合成语音”作为“双顾问”,利用对比学习技术,引导AI模型在训练过程中同时对齐语义特征和声学特征。“这就像在语言翻译过程中,不仅参考词语的表面意思(文本),还结合了语境和发音规则(语音)进行综合判断。”同济医院神经外科学术主任、华中科技大学人工智能与自动化学院副院长伍冬睿教授解释道。
实验结果显示,这种融合多种任务相关模态的跨模态知识辅助机制显著提升了模型从复杂大脑信号中提取有效特征的能力,在48词分类任务中实现了解码准确率的有效提升。同时,研究还证实了颞叶及感觉运动皮层在中文言语生成过程中的核心作用,为后续神经机制研究指明了方向。
四、 展望:从实验室走向临床的坚实一步
尽管作为非侵入式技术的探索先行者,当前的解码准确率距离临床完全自由交流仍有提升空间,但该研究的价值在于其开创性和奠基性。如同建造高楼需要先打下坚实地基,本研究利用任务相关模态对MEG高分辨率神经信号进行辅助解码,成功验证了该技术路线在中文解码中的可行性,为后续研究提供了完整的方法论框架。
“这项研究更像是一块基石。”同济医院脑机接口研究院院长唐洲平教授评价道,“它为未来构建高精度、多模态系统补齐了关键一环。展望未来,通过将MEG的高时空分辨率优势与EEG的便携性有机融合,脑机接口的解码性能有望迎来质的飞跃。”
“这项工作是同济医院与华中科技大学人工智能与自动化学院深度合作的结晶,也是医院医工交叉协同创新的生动实践。”同济医院院长胡俊波教授表示,“未来,医院团队将持续推动技术临床转化,开展面向失语患者的专项研究,并进一步探索跨语言解码等更具挑战性的前沿方向。我们的最终目标,是让这项技术真正走出实验室、服务于患者,为提升我国脑科学研究的国际影响力贡献‘同济智慧’。”
“读懂”中国话:我国科学家在非侵入式脑机接口中文解码领域取得阶段性进展