人类的“机械协同进化”:脑机接口的概念、技术与未来

文 / 冯尚(复旦大学神经生物学在读博士)

图 / Ines Cui(佛罗伦萨美术学院策展在读硕士)

人类的未来形态是什么样子的?不论是《攻壳机动队》还是《黑客帝国》,许多科幻作品都畅想过人类与机械“融为一体”。人类的智慧加上机械的力量,共同塑造出地球上前所未有的强大存在物——超人类(transhuman)。百年以来,随着生命科学等基础科学领域不断向前推进——例如基因编辑技术、神经信号记录与操纵技术的发展,我们似乎终于有希望朝着这样的未来迈进。

当下蓬勃发展的脑机接口(BCI),便是被寄予厚望的技术之一。通过记录和处理人类大脑信号从而执行特定功能,脑机接口的目的是人脑和机器实现直接通信。它融会了神经科学、信号处理、机器学习、机器人系统、材料学等诸多学科,是当前十分热门的前沿交叉领域。

使用大脑信号来控制假肢的设想,最早由劳埃德·M.尼尔伯格(Lloyd M. Nirenberg)等人于1971年提出。此后,一批又一批科学家试图通过解码大脑电信号,来建立一种能更加准确而方便地控制外部设备的手段。到了2002年,这个研究领域才有了统一的名称。随着神经科学与相关技术的突破,脑机接口开始快速发展——从帮助瘫痪者重获行动能力的辅助设备,到Neuralink等初创公司意欲贩卖的概念产品。

脑机接口的基本思路并不复杂,大致可分为“三步走”:首先,获取大脑活动信息,最常见的做法是记录大脑电活动;其次,使用算法将大脑信号翻译为预先定义好的输出指令;最后,将输出指令传给外部设备,实现特定的功能。这个基本思路虽然简洁而直接,可一旦落到实操层面,就会面临诸多技术细节问题。

脑机接口的第一步是读取大脑的活动信息。神经科学家希望通过某些方法得到各脑区的精确活动情况,进而解码人的主观体验、运动意图,甚至思维活动。当前比较成熟的、可用于人类的主流“读脑”技术有脑电图(EEG)、功能磁共振成像(fMRI)、近红外光谱(NIRS)等。它们获得的数据各有优劣。因此,为了尽可能最大化系统的稳定性、提高信号传输速率、降低训练时长,脑机接口系统通常会采集并分析多种信号以互相补充。

这些读取大脑活动的技术,基于是否需要将电极植入大脑,一般分为侵入式和非侵入式两种手段。脑电图就是一种非侵入式的技术,研究者已经通过脑电图实现了比较不错的进展。例如在2019年一项发表于《科学-机器人学》(Science Robotics)的研究中,贺斌教授团队就通过解码脑电图数据,让6名健康被试通过“意念”成功操控了机器手臂。

大脑活动测量技术对比图(点击可查看大图)

脑机接口的第二步是通过算法将大脑活动信息翻译为特定的输出指令,从而用于后续行为。具体来讲,就是利用特定的分类算法,将大脑活动信息区分为一个个具体的“类型”。

这些分类算法有三个关键特征:采用了哪一种传递函数;适应能力如何;生成了怎样的输出指令。传递函数可以是线性的(如线性判别分析),也可以是非线性的(如人工神经网络)。适应算法则可以使用复杂的机器学习算法以适应多变的大脑情况。

脑机接口对分类算法的基本要求是:确保分类的高准确性。以操纵轮椅的应用场景为例,被试希望通过脑机接口操纵身下的电动轮椅,让它按自己的意愿前后左右移动。那么,每当被试希望“向左移动”时,脑机接口的分类器应当读取此时被试的大脑活动信号,提取其中的有用信息,并将其分辨为“向左移动”的类别,随后给轮椅的电机发送“向左移动”的控制命令。不难发现,确保顺利完成此类任务的关键在于:分类算法必须准确、可靠且稳定地完成每一次分类。这就需要仔细挑选分类所需的大脑信号特征,使得在任务相关活动中,这种特征在不同的类别之间存在显著差别,并能被分类算法捕捉到。

脑机接口的第三步,是将第二步生成的输出指令(也称作“控制命令”)应用在具体的场景中。输出指令可以是离散量,也可以是连续量,视具体的应用设备而定。离散的输出量一般用于在众多固定值中做选择(如选择字母),而连续量则可用于导航任务(如移动鼠标指针、操纵机械手臂等)。

在操纵运动设备的场景中,输出指令的“时间特性与信号强度的匹配”至关重要。以操纵机械手臂和机械手指来实现精细操作的脑机接口应用为例:机械手臂和手指的精细运动,涉及众多关节(如肩关节、肘关节、手指的多个关节)位置的三维运动,这些运动由一系列复杂装配的电机来协同完成。一旦这些电机的运动在时间上没有精确匹配,或者某些电机的运动幅度过大/过小,就会造成动作的不协调甚至卡顿、失败,从而无法完成预想的精密运动。

科幻作品为我们描绘了脑机接口带来的未来图景,但当前人类仍然挣扎在这项技术最初分娩的阵痛期。人们对脑机接口相关学科的基本理论、技术细节和应用场景的探索仍处在初级阶段,这种“初级”也许从学者期望借助脑机接口完成的任务类型中就可见一斑。

最初,人们主要想通过脑机接口实现对运动障碍病人的治疗。研究者将脑机接口当作一种媒介,连接病人的大脑运动皮层与特定的肢体,来帮助病人重获对自己身体的控制。后来,科学家逐渐为脑机接口找到了更多的应用场景——例如运动功能康复、控制机器人等,但目前看来依然比较局限且尚未成熟。

从理论上,可以按照“脑机接口”的通讯内容,将其分类为已经初步实现的意念运动接口、外部刺激接口和更高级但尚未实现的情感思维记忆接口。

意念运动一直是脑机接口的主要目标之一:仅仅在头脑中“想象”自己身体的运动(如想象移动一只手、一只脚,或者舌头),但并不实际做出运动。意念运动在生活中十分普遍,它常见于普通人的梦境中或专业运动员上场前的冥想中。先前的研究已经证实,意念运动时激活的脑区足以引发真实的运动,因此倘若读取这些脑区的活动模式,就有可能解码被试的运动意图,并通过机械装置将其实现。

大脑受到外部的感觉刺激(如闪光或声响、温度、触摸等)影响,可以产生相应的脑电信号。外部刺激接口,便希望将外界的感官刺激(视觉、听觉、嗅觉、体感等)引发的大脑激活模式,通过脑机接口进行读取并用于操纵设备或实现其他应用。在基于脑电图的脑机接口系统里,最常见的一种实验观测内容是“视觉P300”(以下简称P300)。P300是一种被研究得最为透彻的事件相关电位(ERP)。所谓事件相关电位,指的是由特定的事件类型(如视觉闪光刺激、皮肤电流刺激、听觉刺激等)引发的脑电图平均信号。根据定义,P300是在事件发生后250—500毫秒内出现的一种幅度为5—10毫伏、符号为正的脑电波成分。科学家如此执着于P300信号,是因为它具有难以替代的优势:大部分被试都可以产生高精确度的P300信号,并且这种信号在几分钟内就可以被校准到适宜实验的状态。因此,脑机接口系统可以轻松、快速地借助P300信号来控制外部设备。

思维情感记忆接口是目前仍难以实现的一种设想,即直接读取被试的情感、记忆乃至思想。虽然在实验动物身上已经初步实现了对情感和记忆的读取(甚至写入),但这项技术何时能应用于人类仍未可知。这项技术目前面临最大的困难是:人类仍未理解大脑产生思想活动的基本原理。因此,即便记录到详尽的大脑各区域激活情况,也难以对其解码。

脑机接口的连接也不应仅仅是单向度的。假如电脑的USB接口只能向外传输文件,不能接收文件,你会觉得它是一个合格的“接口”吗?当前主流的脑机接口就是这样一个单向传输的系统:信号从人脑传输到机器,却不能反向操作。

目前比较成熟且相对简单的技术也许是“经颅磁刺激”或“经颅直流电刺激”,它们可以穿透颅骨,从外部给特定脑区直接施加电磁场,从而调节特定脑区的兴奋或抑制水平。利用此类技术,科学家已经成功在人脑中植入了有意义的简单视觉图像,但更进一步的突破仍需要脑科学基础研究和相关技术的协同发展。

近年来,尽管脑机接口实现了很多突破,但仍面临着脑科学基础研究的局限性。对神经科学家而言,人脑高级功能的基本原理与信号编码方式依然是一个巨大的谜题。事实上,即便是基础的感觉功能研究,神经科学家也只是刚刚迈出了第一只脚。根据已有的神经生物学理论,科学家可以对脑信号做出初步的解码与翻译,但难以有更进一步的突破。

此外,还有技术方法的限制。目前一般认为,精细而高级的脑功能可能采取稀疏编码方式,即通过尽可能少的神经元来编码尽可能多的信息。另外,近期一系列研究提示我们:神经元的“时间激活模式”与“群体同步性”也编码了重要的信息。这意味着,针对高级脑功能的读脑术需要做到很高的时间-空间分辨率。再就是人脑和材料的生物相容性问题,“坚硬”的植入物如何最大限度地不损伤“柔软”的脑组织?满足上述要求的技术目前已初露端倪,但距离应用到人脑,恐怕还要历经数年乃至更久。

不过,在脑机接口真正实现之前,我们仍然可以保留一点想象力:不论是“缸中之脑”,还是《攻壳机动队》里人类的“义体化”,《黑客帝国》中思维与身体的分离。化用媒介理论家马歇尔·麦克卢汉的话来说,在脑机接口面前,或许一切技术都是人脑的延伸。甚至不仅如此,我愿意将“脑机接口”的终极发展方向称为科技泛灵论——人与万物互联。

(原载于《信睿周报》第41期,参考文献略)

(0)

相关推荐