解锁大脑内部的GPS,我们如何构建认知地图?
设想你被置于一个迷宫之中,曲折的走廊、死胡同,通往奖励的多条道路交错其中。你将如何巧妙导航,以便有效地找到你的奖励?再想象几个月后,你再次回到同一个迷宫,你还能回忆起正确的路径吗?
我们大多数人都曾在陌生的地方迷失方向,却能在随后的访问中重新找到我们的足迹。这种能力源于我们大脑中一个编码了地点、路线和奖励之间关系的“认知地图”。科学家们相信,这个神经GPS的核心部分位于海马体中。但这个认知地图究竟是如何在海马体中产生的呢?
为了揭开这一谜团,霍华德·休斯医学研究所的研究人员训练小鼠跑过屏幕显示的虚拟迷宫。这些迷宫有不同的路径通向有水的奖励区。在小鼠学习布局的几周时间里,微型显微镜记录了数千个海马细胞的钙信号。迷宫跑道的墙壁在视觉上都是相同的灰色,唯一的区别在于一些标志着奖励区域的独特地标,随机呈现在轨道的不同位置(远/近)。为了获得水的奖励,小鼠必须记住最初的地标,并在到达跑道上相应的奖励区域时舔舐。
起初,小鼠沿着轨道随意舔舐,并没有将线索与奖励联系起来。但在每天的几次舔舐中,小鼠的舔舐开始集中在奖励区附近。细胞的活动也发生了变化,它们首先区分线索位置,然后在两条路径上逐渐解除关联。
这种去相关性依次发生,靠近早期奖励区的细胞首先分化。最终,重叠片段的细胞活动正交化为相互排斥的表征,就像状态机一样。状态机是一种作为自动贩卖机等设备基础的计算模型。基于当前状态(投入的硬币)和输入(按下的按钮),机器会转换状态并分发食品。同样地,海马地图似乎编码了小鼠的潜在状态(过去的经历和未来的期望),并在它穿梭轨道时在各状态之间转换。研究人员称这种现象为“正交状态机”(orthogonalized state machine,OSM),它将看似相同但却代表不同事物的经验巧妙地分离开来。
为了证实这一点,该团队将任务建模为一台状态机,并使用理想化的输入来模仿小鼠的经历。值得注意的是,细胞活动的这种转变与用于预测输入序列的计算模型紧密匹配,而无需明确告知奖励。这些模型从模糊的感觉中提取有意义的潜在状态,类似于动物揭示迷宫隐藏结构的方式。这种正交状态机可以通过基于隐马尔可夫模型(HMM)的模型或循环神经网络,使用赫布学习进行训练(利用无监督的局部学习规则,而不是误差反向传播),以此便能重现正交状态机在改变的任务条件下的灵活使用。
这些发现揭示了海马地图是如何以结构化的神经代码表示空间、时间和奖励关系的。将环境结构提取到状态机中,可以在遭遇或奖励变化时实现迅速适应。就像我们通过将新建筑的布局叠加到与之相关的认知地图上来学习一样。
揭示认知地图背后的算法,将从根本上推动神经科学的发展,并可能指导更灵活人工智能的开发。正如GPS使我们摆脱了纸质地图一样,关于生物GPS的洞见可能会催生出更聪明、更具适应性的机器。
文献:Sun, Weinan, et al. "Learning produces a hippocampal cognitive map in the form of an orthogonalized state machine." bioRxiv (2023): 2023-08.
DOI:https://doi.org/10.1101/2023.08.03.551900
作者:光影 | 封面:Tierra Connor
本文来自微信公众号“神经现实”(ID:neureality),作者:光影,36氪经授权发布。