交流是人类的一项基本活动。然而,由于意外事故、疾病等原因,一些人丧失了部分甚至全部的信息交流能力。例如,患有神经症状或者神经退化性疾病的人群,其中枢神经系统与效应器之间的正常信息传递收到阻碍,从而导致人体的动作意图无法表达或者实施。常见的这类疾病或损伤有肌萎缩性脊髓侧索硬化症、脊髓损伤、中风等。该类病患人群失去与外界交流的正常途径,从而成为一个自我封闭的个体。因此,为他们重建与外界交流的信息通路具有重要的现实意义,而脑-机接口(Brain-Computer Interface, BCI)就是其中这样一条途径。第一个BCI系统是由加州大学洛杉矶分校的Jacques Vidal于1970年设计的[1]。该套BCI系统可以让用户通过思维直接驱动屏幕上的光标进行二维平面运动。
脑-机接口的定义在美国纽约州召开的第一次BCI国际会议给出的BCI的定义是:BCI是一种特殊的通讯系统,它不依赖于人体的外围神经和肌肉组织[2]。该定义反映了BCI的基本原则和特征,即BCI是完全不依赖于外围神经和肌肉的新型交互手段,它实现了脑和计算机之间的直接通信。
美国Wadsworth研究中心的Wolpaw等人在其著作《Brain-computer interfaces: principles and practice》中给出了BCI更加严格的定义:脑-机接口是一个通过检测中枢神经系统活动,并将其转化为人工输出的系统,它能够替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而改变中枢神经系统与内外环境之间的交互作用[3]。
脑-机接口的原理和基本结构神经活动则是大脑产生思维的基础,而且每一种活动模式都对应着一种特定的思维形态。BCI系统就是通过辨别神经活动的模式,对思维进行解码,并通过控制系统实现与外界环境的交流。
中枢神经系统活动包括发生在中枢神经系统中的电生理活动、神经化学反应和新陈代谢现象,如动作电位、突触后电位、神经递质释放、氧代谢活动等等。通过放置在头皮上、大脑皮层表面或者大脑内的传感器,我们可以检测到与神经活动相关的电磁场、氧合血红蛋白或者其他生理参数的变化。这些参数能够从一个特定的方面反映大脑内部的活动情况。BCI系统通过记录这些大脑活动信号,从中提取出具有明确意义的特征,并将这些特征转换为可以作用于外界或人体本身的输出量。BCI系统的基本结构包括信号采集系统、信号处理与转换系统以及执行单元。
脑-机接口的分类侵入式和非侵入式按照检测信号传感器的安置方式,BCI系统还分为有创植入电极的侵入式BCI和无创头皮电极的非侵入式BCI。
侵入式BCI是通过记录颅骨以下的神经信号来实现对外部设备的控制。通过埋藏在大脑皮层中的记录电极,侵入式BCI可以近距离地监测神经元的活动状况。这样避免了神经活动信号由于远距离传播而引起的衰减,因此,记录到的信号具有极高的信噪比和良好的时间、空间及频率分辨率[4]。目前,侵入式BCI主要用于重建特殊感觉(例如视觉)以及瘫痪病人的运动功能。2012年,Hochberg等人对两名四肢瘫痪病人进行植入式脑机接口实验,实现了机械臂的三维抓握动作[5]。但是,侵入式BCI系统有一个明显的缺点,就是需要通过外科手术将电极植入到脑内神经组织。这样,不仅会对用户造成损伤,而且还要确保伤口长期不被感染,存在一定的技术难度。
为避免电极侵袭大脑引起损伤,BCI系统可以选择非侵入方式来采集脑电信号,即从头皮表面记录神经活动信号。但是,由于大脑的容积导体效应,神经电活动信号从大脑皮层传播至头皮表面时会被大大削弱,而且会损失掉大量关于信号源时空分布的信息[6]。这些均不利于BCI信号的特征提取和模式识别,从而增加了无创BCI的技术难度。目前,非侵入式BCI已经被用于部分神经类疾病患者的康复训练[7]、思维游戏[8][9]等领域。
主动式、反应式和被动式根据脑-机交互过程中大脑的主观心理活动所起的作用,可以将BCI系统划分为主动式、反应式和被动式三大类[10]。
主动式BCI是指用户通过直接且有意识的大脑活动来控制外部设备的一类BCI系统。该类型BCI能够完全独立于外源刺激,也就是说主动式BCI不需要诸如视、听、体等外部刺激的诱导。因此,寻找一种由主观意识引起的、有效稳定的生理信号是建立主动式BCI系统的关键。目前,主动式BCI系统中最常用的生理信号是事件相关去同步/同步(ERD/ERS)信号,它能够反映大脑的运动意图[11]。此外,还有慢皮层电位信号[12]。
反应式BCI是指通过解码大脑对外界刺激所引起的特定响应,来间接地表达出大脑意图的一类BCI系统。因此,反应式BCI系统需要预先产生一些特定模式的刺激物,来引导大脑诱发与自身意图相关的活动模式,再通过对比大脑活动模式与预设模式之间的相关程度,确定大脑的意图指令[13]。所以说,指令的编码与解码是反应式BCI系统中的一个重要环节。目前,反应式BCI的主要编码方式有时分多址、频分多址、码分多址、空分多址以及混合模式。无论哪种编码方式,都需要以某种特定类型的刺激物作用于人体的感觉通道。因此,按作用的感觉通道划分,可以把反应式BCI划分为视觉依赖性、听觉依赖型、体感觉依赖型等等。目前,典型的反应式BCI系统主要有SSVEP系统和P300系统。
被动式BCI是指能够读取用户认知状态变化并用于人-机交互系统的一类BCI系统,它无需用户主动控制[14]。大多学者认为被动式BCI是对传统BCI的一种延伸。传统的BCI系统要求用户主动向外界发送所需的指令。而在使用被动式BCI系统时,用户无需刻意控制自己的大脑活动,系统会读取用户的情绪状态、任务相关心理活动、错误相关心理活动、用户脑力负荷、疲劳等非用户主动控制的心理活动状态,从而实现与外设的交互。其与外界的交互也不是传统BCI那样直接发送控制指令,而是通过利用用户的状态信息优化人机交互过程,从而使外界系统适应用户的状态。例如,根据用户的情绪状态来调节环境元素以维持正常的情绪活动。因此,被动式BCI是传统交互方式的一种加强和辅助方式[10],其应用范围也不再限于为特殊人群提供新的交流途径,而可以在日常工作环境中对用户的情感、脑力负荷、警觉度、疲劳等状态变化进行监测与反馈,以及应用于人误探测与修正等[15]。
典型脑-机接口系统MI系统想象动作(Motor Imagery,MI),是一种动作意图而无实际动作输出。想象某个肢体的运动可以引起相应感觉运动区神经活动的改变,其在脑电信号中的反映就是某些频率成分同步衰减或增强,这种现象称为事件相关去同步化或者同步化现象[16]。因此,MI系统是最贴近人体实际动作执行的BCI系统。正因为如此,MI系统被用于某些运动功能障碍患者的康复训练[17]。2013年,Leeb等人对24名运动功能障碍病人进行BCI对外控制训练,其中50%的参与者能够成功地应用基于想象动作的脑-机接口完成日常交流,如文字输入[18]。
SSVEP系统SSVEP系统利用频分多址进行指令编码,且是视觉依赖性的[19]。在非侵入式BCI系统中,SSVEP系统是目前最快的BCI系统,其最高信息传输率可接近200bit/min[20]。用户在使用SSVEP系统时,会同时面对多个视觉刺激物。所有视觉刺激物都以一个特定且相互不重复的频率闪烁(>6Hz),且每个刺激物都代表着一个特定的指令。当用户想输出某个指令时,只需注视该指令所对应的刺激物即可。SSVEP系统通过解码大脑初级视觉皮层的振荡频率来确定用户所注视的刺激物,并最后转换为相应的机器指令输出。
P300系统P300系统则利用时分多址进行指令编码,其依赖的感觉通道可以是视觉、听觉、触觉甚至是多个感觉通道[21]。P300系统刺激方式必须符合oddball范式,即被分到小概率一类的事件(Oddball事件)是诱发P300电位的目标事件。P300电位是大脑受到外界新奇事件刺激时产生的一个正电位,它通常发生在新奇刺激出现后300ms左右,在大脑顶区最明显。用户在使用P300系统时,会依次接收到代表不同指令的刺激物,当与用户意图一致的指令刺激物出现时,大脑就会产生一个P300信号。通过确定P300信号出现的时间,系统就可以推测出用户在关注哪个刺激物,从而输出正确的操作指令。
本词条内容贡献者为:
明东 - 教授 - 天津大学精密仪器与光电子工程学院