据国外媒体报道,一个由加州大学旧金山分校的研究团队打造的新型人工智能系统可根据人脑信号来生成文本,准确率最高可达97%。

这不完全是科幻小说中的概念。近几十年来,从动物模型到人类参与者,脑机接口技术的发展可谓突飞猛进。事实上,这类技术已经在尝试将这种概念从幻想变成现实。

亚马逊和谷歌等科技公司打造的虚拟助手相当先进,语音识别能力比起几年前进步惊人,近年来人们才刚开始领会它们的威力。

加州大学旧金山分校的研究人员在一项新研究中解释说,目前来看,通过该技术将人脑信号转换成的文本结果还不很准确。

为了探究是否能够改善这一状况,由加州大学旧金山分校Edward Chang实验室神经外科教授Edward Chang领导的一个团队使用了一种全新的方法来解码脑皮质电图:通过植入大脑的电极,来获取皮质活动中所产生的电脉冲记录。

研究人员展示了如何以高准确度和自然语音速率对脑电波进行解码。从机器翻译的最新进展中汲取经验,研究人员优化了一个递归神经网络,将神经活动的每个长句序列编码为抽象代码,然后逐词将该代码解码为英语句子。

实验参与者被要求多次朗读50个固定句子,比如“蒂娜·特纳是流行歌手”,研究者们跟踪了他们讲话时的神经活动。这些数据随后被输入到机器学习算法中,系统能将每个口述句子的大脑活动数据转换为数字字符串。尽管一开始遭受了一些挫折,但他们还是获得了非常不错的成果。

保留的重复集中平均单词错误率低至3%。最后,研究人员展示了如何通过在多个参与者的数据下优化网络的某些层,利用转移学习来改善有限数据的解码。

据悉,在语音从人脑信号中解码出来的十多年后,其准确性和速度仍然远远低于自然语音。

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐