开发这项名为DeWave的技术的澳大利亚研究人员使用来自二十多个受试者的数据测试了该过程。参与者戴着一顶帽子默默地阅读,该帽子通过脑电图(EEG)记录他们的脑电波并将其解码为文本。
通过进一步改进,DeWave可以帮助中风和瘫痪患者进行交流,并使人们更容IM电竞平台易指导仿生手臂或机器人等机器。
“这项研究代表了将原始脑电波直接翻译成语言的开创性努力,标志着该领域的重大突破,”悉尼科技大学(UTS)的计算机科学家Chin-Teng Lin说。

尽管在Lin及其同事进行的实验中,根据两组指标之一,DeWave仅实现了40%以上的准确率,但这比之前的EEG记录思想翻译标准提高了3%。研究人员的目标是将准确率提高到90%左右,这与传统的语言翻译或语音识别软件方法相当。
其他将大脑信号转化为语言的方法需要侵入性手术来植入电极或笨重、昂贵的MRI机器,这使得它们在日常使用中不切实际 , 而且它们通常需要使用眼动追踪将大脑信号转换为单词级别的块。
当一个人的眼睛从一个单词跳到另一个单词时,可以合理地假设他们的大脑在处理每个单词之间会短暂休息。将原始脑电波转换为单词 , 没有眼动追踪来指示相应的单词目标 ,更难。
来自不同人的脑电波并不都以完全相同的方式表示单词之间的中断,这使得教人工智能如何解释个人想法成为一个挑战。
经过大量培训后,DeWave 的编码器将脑电波转换为代码,然后可以根据它们与 DeWave “密码本”中条目的接近程度与特定单词进行匹配。
“这是第一个在脑到文本翻译过程中采用离散编码技术的技术,为神经解码引入了一种创新的方法,”Lin解释IM电竞平台说。“与大型语言模型的集成也为神经科学和人工智能开辟了新的领域。
Lin和他的团队使用了经过训练的语言模型,其中包括一个名为BERT和GPT的系统组合,并在现有的数据集上进行了测试,这些人在阅读文本时记录了眼动追踪和大脑活动。这有助于系统学会将脑电波模式与单词匹配,然后使用开源大型语言模型进一步训练 DeWave,该模型基本上是从单词中组成句子。

“我们认为这是因为当大脑处理这些单词时,语义相似的单词可能会产生相似的脑电波模式,”第一作者,UTS的计算机科学家Yiqun Duan说。“尽管面临挑战,我们的模型还是产生了有意义的结果,对齐了关键词并形成了相似的句子结构。”
测试的样本量相对较大,解决了人们的脑电波分布差异很大的事实,这表明该研究比仅在非常小的样本上进行测试的早期技术更可靠。
还有更多的工作要做,当脑电图信号是通过帽而不是植入大脑的电极接收到时,信号相当嘈杂。“直接从大脑中翻译思想是一项有价值但具有挑战性的工作,需要持续付出巨大的努力,”该团队写道。“鉴于大型语言模型的快速发展,将大脑活动与自然语言联系起来的类似编码方法应该得到更多的关注。