撰文 | 田小婷
前言
想象一下,在紧张刺激的赛车游戏中,人类需要迅速而精准地判断何时踩下油门、何时巧妙地转弯。在根据路况不断改变行驶路径的过程中,人类大脑可以展现出敏捷的决策能力和反应速度。
然而,在人类应对自如的赛车游戏中,传统的神经网络模型只能做出确定性的决策,尚不具备人类的感知行为能力。模拟人类大脑的决策过程,始终是人工智能(AI)领域的一大挑战。
如今,一种新型神经网络模型,有望让 AI 系统像人类赛车手一样,权衡各种选择,做出迅速、精准的决策。
近日,来自佐治亚理工学院的研究团队便提出了一种神经网络模型 RTNet,这一模型不仅能够生成随机决策,还能达到类似人类决策的响应时间分布。
研究团队通过全面的测试发现,RTNet 能够再现人类在准确性、响应时间和置信度上的所有特征,而且表现优于多个当前先进的神经网络模型。
相关研究论文以“The neural network RTNet exhibits the signatures of human perceptual decision-making”为题,发表在科学期刊 Nature Human Behaviour 上。
研究团队表示,即使是功能强大的大语言模型(LLM)也会因为幻觉编造一些不切实际的回答,因此开发一种更接近真实人脑的神经网络可能会使 AI 系统更加可靠。
像人类一样感知决策
近年来,卷积神经网络(CNN)在 AI 图像处理方面取得了很大进展,甚至在医学图像处理等领域超过了人类的水平,但在感知决策的认知模型中与人类的表现仍相较甚远。
传统的 CNN 面对相同的输入信号时,输出的结果总是确定的,而且在处理复杂度不同的图像时,花费的计算时间总是不变的。这也决定了 CNN 模型很难实现人类大脑的感知决策水平,无法根据任务的复杂程度调整反应时间和准确度。
此前,为了解决这些问题,一些研究团队曾尝试为神经网络引入随机性和动态性,开发能够生成动态响应时间的神经网络,但这些模型无法处理复杂的图像输入,结果也是确定性的,还是没有达到人类的感知决策能力。
Google Research 和科罗拉多大学的研究团队曾通过在深度神经网络的前馈网络中引入传播延迟来构建级联网络,产生了图像可计算的动态网络,其通过决策计算资源随时间增加的机制生成响应时间,从而允许响应通过每个处理步骤进行不断地演变。虽然模型可以模拟人类感知决策的速度和准确度,但输出结果还是确定性的,距离人类的感知决策水平还有相当大的距离。
在这项研究中,Farshad Rafiei 等人将现代 CNN 与传统认知模型相结合,创建了一个可进行图像计算、随机且动态的模型。因为该模型能够模拟人类的行为决策响应时间,故将它命名为 RTNet。
图 | 模型的架构(来源:该论文)
他们通过对贝叶斯神经网络进行采样,获得深度神经网络噪声权重,然后在每个处理步骤,从这些有噪声的权重分布中进行采样,来模拟神经响应的随机性。RTNet 也会积累每个选择对应的输出,直到其中一个选择达到预定义的阈值。
为了验证 RTNet 能够适用于各种感知任务,并做出类似人类感知决策的一些基本特征,他们对 RTNet 进行了全面的评估测试。
他们设计了 “二选一” 的决策任务,通过人为改变任务难度,来对比 RTNet 模型与 60名 参与者进行决策判断的响应时间和准确度,从而验证 RTNet 在模拟人类行为方面的出色表现。
人类行为的一个核心特征就是决策具有随机性,面对同样的情况可能做出不同的决策,研究人员将人类行为与 RTNet、CNet、BLNet 和 MSDNet 的行为进行了比较。
实验充分考虑了人类决策的随机性、增加响应时间带来的准确性下降、复杂度高的决策导致的准确性降低等干扰因素,来验证 RTNet 在决策上的随机性是鲁棒、可靠的。
图 | 实验参与者和四个神经网络模型在决策随机性的表现(来源:该论文)
研究发现,模型表现出的决策随机性随着任务难度的增加而增加,在 20% 的试验中,RTNet 对两个图像表现出了不同的响应。虽低于人类的反应水平,随着任务难度和速度要求的提高,RTNet 决策的随机性也在提高。
与之相反,对于固定的任务,CNet、BLNet 和 MSDNet 的决策是完全确定性的,并且没有表现出任何随机性。RTNet 在捕获感知决策特征方面表现出优于 CNet、BLNet 和 MSDNet 的特征,RTNet 也是唯一一个能够模拟时间响应分布形状和偏度,以响应任务难度进行不同操作的模型。
不足与展望
总的来说,RTNet 表现出了类人感知决策的关键特征,具有广泛的应用前景。此外,RTNet 也为开发更加逼真的 AI 模型提供了新的思路,未来在医疗诊断、自动驾驶和人机交互等领域将发挥重要作用。
研究人员推测,RTNet 能够匹配观察到的人类行为模式,主要是因为其内部机制更接近人类产生响应时间的真实机制。RTNet 通过模仿重复呈现相同刺激的神经元反应,在证据积累的过程中,自然地产生持久的神经元激活,所以模型的输出本质上是随机的。
但 RTNet 也存在一定的局限性,它在每次从选择中进行证据采样的机制不是最佳的,且前馈路径的每次扫描都独立于先前的状态,但人脑一般当前的状态会受到其先前状态的影响。
研究人员表示,未来的研究可以进一步优化 RTNet 的生物学合理性,例如引入递归处理机制,并使用其他方法来设置每个连接的噪声级别,来更好地模拟人类大脑的处理方式。