有效编码假设,是由霍雷斯·巴罗于1961年为脑的感知编码提出的一个理论模型。霍雷斯·巴罗认为:生物视觉系统初级阶段的一个重要功能就是尽可能的去除输入刺激的统计冗余。初级视皮层的视神经细胞对外界环境的响应满足稀疏编码的特性,稀疏编码指在尽可能完整的表示输入刺激模式的基础上,使激活的神经细胞的个数尽可能少1。
主要内容在脑中,神经元通过传递一些电脉冲进行联系,这种电脉冲被称作动作电位或者神经冲动。感觉神经科学的一个目标,就是解码这些动作电位的意义,以便理解脑是如何表现和处理外部世界的信息。巴罗假设,感觉系统的动作电位形成了神经编码用来有效地表达感觉信息。 巴罗所说的“有效”,指的是神经编码会使得传递一个给定信号所需要的动作电位数量最少。这有点类似在互联网上传递信息,可以使用不同的文件格式来传送同一张图片。对于同一张图片来说,使用不同的文件格式会需要不同的比特数来达到同样的分辨率。这个模型认为,脑会使用适合表达生物生活的自然环境的视觉和听觉信息的编码2。
有效编码模型从方法论上,有效编码研究主要可以分为两条路线:直接的方法是从生物机理上,在自然图像刺激条件下检测神经细胞的响应特性,我们叫做机理测试;另外一个替代的方法是利用自然图像的统计特性,建立模型模拟早期视觉处理系统的处理机制,叫做模型仿真。在有效编码模型仿真中,我们首先考察外部环境刺激的统计特性,根据特定的统计优化准则建立响应模型,然后与初级视皮层中神经细胞的响应特性(神经生理学)进行比较1。
随着输入信号维数的增加,描述输入信号联合分布的复杂度会指数增长。因此,我们通常针对特定的统计特性,或者指定特定的分解算法来简化问题。常用的有效编码算法可以分为三种。第一是基于二阶统计量的线性有效编码模型,第二是基于高阶统计量的线性模型,第三是基于高阶统计量的非线性模型1。
研究意义有效编码理论是神经生物学、计算机科学和心理学的交叉研究领域。随着对生物视觉系统研究的进一步细致,以及计算机技术的飞速发展,近年来,有效编码假设理论成为了人们研究的一个热点,人们从神经生物学机理模型和计算机科学可计算模型等角度进行了广泛的研究,很多重大的成果对生物和机器视觉,乃至脑科学的发展产生了重要的影响1。
挑战和发展方向尽管有效编码假设无论从神经生物学机理还是从可计算模型都得到了广泛的验证,但是有效编码假设在有些方面也不够完善,受到部分研究者的质疑。以下是有效编码假设理论的不足和挑战,以及进一步研究的发展方向1。
视觉目标有效编码的首要的不足就是没有考虑视觉系统的目标。有效编码假设理论只表明外界信息必须有效表示,但是没有考虑表示什么样的信息。很多研究者认为在视觉通道的低级阶段(例如视网膜,V1区),因为编码的信息要被高级阶段不同的神经细胞适用于不同的场合,编码外界信号时保存尽可能多的外界信息是有道理的。有效编码模型成功的解释了视网膜,V1简单细胞的响应特性说明了这一点1。
但是,视觉通道高级阶段的神经细胞就不一定符合有效编码假设。有效编码假设并没有考虑编码的信息怎么被使用,而只考虑怎样使得编码的信息最大化。显然,视觉任务与视觉系统的内部编码是密切相关的,不同视觉任务的内部编码可能会不一样。例如,为了识别一个对象所进行的编码跟存储一个对象的编码是不一样的,前者的编码更加侧重内部编码的可识别能力,而后者更加侧重编码的容量1。
有效编码假设中必须使用Bayesian规则综合考虑外界环境的统计特性和视觉任务或者目标,建立与视觉任务相关的更加完善的有效编码理论。
视皮层神经细胞的冗余表示基于视网膜神经节细胞数目和初级视皮层神经细胞数目的比较,有些研究者对有效编码假设提出了相反的观点:“参与感官信息处理的神经细胞数目,越往视觉通道的高层其数目也越大,因此大脑的神经编码增加了信息的冗余性”。这个观点的前提条件是每一个神经细胞的编码能力是相同的。但是对于这一个前提很多研究表明并不是这么一回事,如果不同的神经细胞编码的方式和编码能力允许不一样的话,那么使用多个神经细胞编码的信息就不一定比用少数的冗余。这在神经生理学是一个开放的课题1。
本词条内容贡献者为:
黎明 - 副教授 - 西南大学