语言是人类最重要的交流工具,但脑卒中、渐冻症、脑外伤等重大脑疾病常使患者陷入意识清醒却无法开口的困境。
据统计,中国有近800万患者因各类脑疾病失去语言表达能力,这些患者迫切需要新的医疗手段来恢复沟通能力。
长期以来,脑机接口技术被寄予厚望,但国际研究主要集中在英语解码领域,汉语解码研究由于起步较晚而进展相对缓慢。
中国科学院上海微系统与信息技术研究所研究员周志涛团队的突破性进展填补了这一空白。
该团队首次实现了汉语实时解码,并实现了覆盖汉语几乎全部音节的全谱解码。
这一成就并非简单复制英语解码方案,而是基于对汉语自身特点的深入理解。
汉语与英语存在本质差异。
英语是以多音节为主的非声调语言,常用单词约为2万个;而汉语是以单音节为主的声调语言,通过约400个汉语音节加4个声调,可构建出覆盖日常需求的3500多个常用汉字。
这种差异蕴含着独特的技术优势。
研究团队创新性地提出了以"音节+声调"为核心的中间解码单元策略。
相比音素,音节是更完整、更充分的发音单位,持续时间更长、神经表征更稳定,更有利于从脑电信号中提取区分特征。
通过直接解码音节,可以省去声母、韵母再组合的复杂中间步骤,大幅提升解码效率。
在具体技术实现上,研究团队构建了多级实时解码数据流。
系统以50毫秒滑动窗口提取70Hz至170Hz的High-γ频段脑电信号,对齐脑电信号与发音起始点,驱动双流解码器同步生成音节与声调的概率分布,进而融合语言模型进行最合适的句子组合选择,最终实现实时汉语语句输出。
这一流程完整实现了从"脑电—音节—汉字—语句"的闭环转换。
临床试验数据令人鼓舞。
受试者经过9天的语言解码任务后,394个汉语音节的纯神经解码平均准确率达到71.2%,单音节解码延时仅为65毫秒,实时汉语语句解码速率达到49.6字每分钟。
这些指标表明该系统已具备实用价值。
更值得关注的是,研究团队进一步将语言脑机接口与人工智能、具身智能技术相融合,基于自主研发的通用型脑机操作系统,实现了多种全新交互方式。
受试者可以通过脑电解码驱动数字分身进行表达,可以直接与人工智能大模型对话,也可以将解码出的语言转化为控制指令,实时操控灵巧手完成抓握等动作。
这意味着语言脑机接口的应用已经超越了单纯的"说话"功能,而是成为人与外部世界交互的新型接口。
周志涛表示,在人工智能时代,语言解码不仅能帮助失语患者恢复表达能力,还可以增强人本身的能力,让人变成"超人",极大地拓展控制和交互的想象力和可能性。
语言脑机接口可以作为一个控制中枢和信息枢纽,通过各种新型交互方式的实现,帮助人控制各种先进软硬件并与其高效协作。
面向临床应用,该技术仍需克服多项挑战。
如何实现长期稳定植入,在更长时间内保持高质量脑信号采集,降低组织反应,这些都是亟待解决的问题。
此外,汉语神经编码机制本身也需进一步探索。
研究团队表示,下一步将优先利用最新的全无线全植入全功能脑机接口设备,开展长期植入实验,为最终的临床转化奠定基础。
这项凝聚中国智慧的科研突破,不仅彰显了我国在脑科学前沿领域的研究实力,更体现了科技以人为本的发展理念。
当冰冷的电极与温暖的汉语相遇,科技正在重新定义生命的可能性。
随着研究的深入,我们期待看到更多患者能够突破身体的限制,重新找回表达自我、连接世界的声音。
这既是科学的胜利,更是人类尊严的守护。