中国科学家实现汉语脑机接口实时解码 失语患者有望重获语言表达能力

问题:语言是人类最重要的沟通方式之一,但脑卒中、渐冻症、脑外伤等疾病可能损伤语言涉及的脑区与运动通路,让部分患者陷入“意识清醒却难以表达”的困境。我国失语及严重语言障碍人群规模较大,如何患者认知与意愿保留的情况下重新建立表达通道,是康复医学与神经工程共同面对的现实课题。 原因:从技术演进看,语言脑机接口要把复杂的神经活动转化为可用的文字或语音输出,关键在于信号采集质量、解码策略与实时闭环能力。过去国际研究主要积累在英语等非声调语言上,但汉语在结构与语音规律上差异明显:一上,汉语以单音节为主,声调承担语义区分功能;另一方面,常用表达往往由有限音节与声调组合即可覆盖。如何把这些语言学特征转化为可解码、可泛化、可实时的工程路径,是相关研究推进相对缓慢的重要原因之一。 影响:此次研究提出以“音节+声调”为核心的中间解码单元,利用音节更完整、持续时间更长、神经表征更稳定的特点,降低从脑电信号中提取可区分特征的难度,并减少拆分与重组环节,从而提升效率与可用性。在系统实现层面,团队构建了实时解码数据流:通过短时滑动窗口提取特定频段脑电特征,驱动解码器同步输出音节与声调的概率分布,再结合语言模型完成语句选择,实现从“脑电—音节—汉字—语句”的闭环。公开结果显示,受试者在一定训练周期后,覆盖绝大多数常用音节的纯神经解码准确率达到较高水平,单音节解码延时达到毫秒级,语句输出速度接近日常交流的基础需求。对失语患者而言,这意味着“想说的话”有机会更直接、更连续地转化为文本或语音;对行业而言,这为多语言解码提供了新的技术思路,也为脑机接口从实验室走向可用产品提供了参考路径。 对策:面向临床落地,语言脑机接口仍需跨越多重关口。首先是长期植入与稳定性,如何在更长时间尺度上保持高质量信号采集,减少组织反应与信号漂移,需要材料、结构与手术路径协同优化。其次是适配性与可推广性,现阶段研究多基于有限受试者与特定任务范式,后续需在更广泛人群、不同病因类型及多场景交流需求中验证鲁棒性,并建立更一致的评估体系。再次是系统级安全与伦理治理,涉及隐私保护、数据使用边界、风险告知与术后管理等,应与临床规范和监管要求同步推进。同时,语言解码不应止于“输出文字”,还需要与康复训练、辅助沟通设备和护理流程衔接,形成可持续的医疗服务路径,才能降低患者与家庭的使用门槛。 前景:值得关注的是,研究团队还探索将语言脑机接口与多种交互形态结合,在通用型脑机操作系统框架下实现“表达—对话—控制”的扩展:例如驱动数字分身进行表达、与智能对话系统交互、将解码结果转化为控制指令以操控外部设备完成动作等。这提示语言脑机接口可能从“恢复表达能力”走向“扩展交互能力”,在医疗康复之外打开人机协作的新空间。未来一段时间,行业发展重点预计将从单点指标(准确率、速度)拓展到系统工程能力(长期稳定、可维护、可规模化),并在临床试验、产业链配套与标准体系建设中加速融合。随着对汉语神经编码机制的更研究,以及材料与算法持续迭代,面向重度语言障碍人群的沟通重建方案有望逐步从“可行”走向“可用”。

这项跨越语言障碍的技术进展,不仅拓展了医患沟通的可能,也在数字时代重新拉近了思想、语言与行动之间的距离。当想法能够更直接地转化为语言和行为,我们或许正在见证交流方式的重要变化。如何让这项技术真正惠及更多患者,同时稳妥应对伦理与治理挑战,将是下一阶段需要持续回答的问题。