【Neuron作者来信】战略与战术在脑中的“双向奔赴”:灵活决策的神经基础
自从放了暑假,小胖就承担起了家里的一项重大决策任务:去水果摊买水果。这天小胖来到西瓜摊,心想香蕉是看颜色挑的,西瓜想必也是绿色越浅越好吃。没想到这个浅绿的瓜一切开,倒是把妈妈脸气绿了。
来源: tech.sina.com.cn/other/2004-06-17/1436376950.shtml
小胖不信邪,下一次精挑细选了一个颜色最浅的瓜,结果还是不好吃。也许买西瓜不应该看颜色?经过多次尝试,小胖终于掌握了观察瓜蒂形状的挑瓜大法。过了几天,小胖胸有成竹的再次接过妈妈给的二十块钱,却不想妈妈说:“最近吃瓜吃腻了,今天去买两斤荔枝吧!”唉,又要重新开始摸索方法了。。。
作为人类行为的司令部,大脑是如何指导这些生活中大大小小的决策的呢?经典的感知决策研究通过训练人和实验动物做一些明确而固定的任务(如下图),去探索大脑基于感知的选择机制(Gold and Shadlen, 2007)。
真实世界的决策就像小胖挑水果一样,在做感知决策这个”战术任务” (”哪个瓜的皮更绿?”)之前,还有一个更重要的”战略判断”(关键问题是”瓜皮颜色”还是”瓜蒂形状”?);而且往往找到关键的问题比找到正确的答案更困难。根据瞬息万变的具体情况灵活调整”战略方向”,在”战术任务”之间切换,是高等动物得以学习和创造的基础,也往往是孤独症、药物滥用和老年痴呆等常见疾病最先伤害的认知功能(Brady, Gray and Tolliver, 2011; Parker and Newsome, 1998; Dickstein et al., 2007)。但是,脑在做决策的时候,对于”战略”和”战术”是否是两个独立的问题呢?
近期,来自匹兹堡大学Marlene Cohen教授研究组的最新工作提示这两种貌似不同层面的认知的神经机制,却是互相影响不可分离的。我们很荣幸邀请到该文章的第一作者薛澄博士对这项最新工作开展解读,该文发表在最新一期的Neuron杂志 (Xue, Kramer and Cohen, 2022)。
薛澄博士,于南京大学匡亚明学院与物理学院获得本科与硕士学位,博士期间师从哥廷根大学Stefan Treue教授,于德国灵长类中心研究视觉注意的神经机制。毕业后在美国匹兹堡大学Marlene Cohen组继续博士后工作,使用行为猕猴电生理,人类心理物理,计算神经(包括脉冲神经网络和循环神经网络)等手段研究灵活决策行为的神经机制。代表工作以第一作者发表于Neuron,PNAS,Cerebral Cortex, Journal of Neuroscience等主流学术期刊。目前担任匹兹堡大学神经科学系研究助理教授,即将赴芝加哥大学神经生物学系担任专职研究员。
认知状态读心术
不管是”战略方向”还是”战术任务”,这些决策相关的认知状态,在做出选择行为之前都隐藏在我们的大脑这个黑匣子里。如何去探索灵活决策行为的神经机制呢?作者训练猕猴做一个类似于小胖挑水果的任务:猴子需要依据屏幕上光栅刺激的位置或者疏密做出感知决策(“战术任务“),而这两者哪个才是关键特征,则需要猴子经过多次试验总结出来(“战略判断”)。实验者通过偶尔切换关键特征,则可以不断重复这一尝试和学习的过程。与此同时,作者使用侵入式大规模电生理记录采集了初级视皮层V1区(负责视觉感知)的神经元群和顶叶皮层7a区(负责多种任务间切换)的神经元群的电活动,将大脑中正在进行的”战略判断” 和“战术决策”的信号实时读取出来,以便研究两者的互相影响和互动关系(图1)。
战略上的自信,战术上的优势
有意思的是,行为数据说明,灵活决策并不能分离为找到关键问题和找到这个问题的答案这两个独立的过程。事实上,当被试对自己的”战略方向” 比较自信时(比如小胖第一次挑瓜,坚信瓜皮颜色是关键),同样的”战术任务”(比较两个瓜的瓜皮颜色)会比不自信时(比如小胖第二次挑瓜,虽然姑且还是按颜色挑,但对颜色是否重要产生怀疑)完成的更好。
后续实验证实,人类行为中也有相同的现象(图2)。
而在神经机制层面上,作者发现,从7a区神经元群读取的”战略判断”(按颜色挑瓜)的自信度,与从V1区神经元群读取到对应的”战术决策”(瓜A比瓜B更绿)的自信度呈正关联,而与和”战略方向”无关的”战术决策”(瓜A比瓜B更大)的自信度无关联(图3)。这些结果说明所谓”战略自信导致战术优势”的行为现象并不是由被试整体的清醒或专注程度等非特异性状态导致的现象,而是战略上的认知选择性的改变了战术上的感知的结果。后续工作则通过新设计的线上人类实验和搭建人工神经网络模型,更进一步说明这一现象的神经机制可能与工作记忆对有用信息的筛选有关。
战术自信的涨落影响战略的调整
“战略判断”对”战术任务”的影响也并非是一条单向道:很显然,”战略方向”的调整依靠的也是对”战术决策”的复盘反思。就像小胖学习挑西瓜的过程中,通过多次尝试确认自己辨别瓜皮颜色的”战术决策”没有错,才认识到错误的是战略方向,并进一步做出调整。问题是,这个”通过战术复盘调整战略”的过程,依据的仅仅是客观事实吗?两次一模一样的经历,是否对决策战略的调整就一定有相同的影响呢?为了解答这个问题,作者搭建了一个贝叶斯模型,通过从猕猴V1区神经元群读取到的”战术决策”的自信度,结合猕猴的做出的选择和得到的反馈,去预测猕猴反思过本次试验的经验后,下一次试验的”战略判断”。由于大脑内的信号噪声和各种主观因素影响,即使两次试验从外部观察是一模一样的经历,作者从V1区神经元群读取到的自信度也会有涨落。结果发现,这些”战术层面”上相对主观的自信度涨落,对于模型预测猕猴下一次试验的”战略调整”也是不可或缺的(图4)。
这些结果说明,我们日常生活中的灵活决策,在大脑中并非是作为”战略判断”和”战术任务”两个独立的问题处理,而是一个整合在一起的涉及多个脑区的系统。
这些发现至少可以带来三方面的启发:
01
灵活调整”战略方向”依赖于负责”战术任务”的脑区的信号和噪声,这意味着那些伤害我们认知灵活性的神经疾病的机制,或许远比我们想象的广泛而复杂,其关键可能在于不同脑区之间的交流。
02
以本文的结果为例,人类的决策行为有诸多奇特的现象,而这些现象都有其生物基础。在机器学习飞速进步的时代,开发出超越人脑决策能力的算法似乎已经近在咫尺,但或许只有当我们完全理解人脑的决策机制,很多社会问题才有希望找到答案。
03
别再鄙视你的老板天天给你画大饼讲废话了,也许他/她是为了增强你的战略信心,帮助你更好的完成KPI啊!
参考文献:
1.Brady, K. T., Gray, K. M. and Tolliver, B. K. (2011) 'Cognitive enhancers in the treatment of substance use disorders: clinical evidence', Pharmacol Biochem Behav, 99(2), pp. 285-94.
2.Dickstein, D. P., Nelson, E. E., McCLURE, E. B., Grimley, M. E., Knopf, L., Brotman, M. A., Rich, B. A., Pine, D. S. and Leibenluft, E. (2007) 'Cognitive flexibility in phenotypes of pediatric bipolar disorder', J Am Acad Child Adolesc Psychiatry, 46(3), pp. 341-355.
3.Gold, J. I. and Shadlen, M. N. (2007) 'The neural basis of decision making', Annu Rev Neurosci, 30, pp. 535-74.
4.Parker, A. J. and Newsome, W. T. (1998) 'Sense and the single neuron: probing the physiology of perception', Annu Rev Neurosci, 21, pp. 227-77.
5.Xue, C., Kramer, L. E. and Cohen, M. R. (2022) 'Dynamic task-belief is an integral part of decision-making', Neuron.
对于感知觉决策的研究,我们可以借助电生理、行为学、心理学等研究手段开展分析,也可以借助工具病毒载体以及光遗传、化学遗传学等操控手段开展脑活动的干预,分析决策的因果和神经机制。和元生物可为神经科学研究提供全面、高质、性价比超高的病毒载体,助力脑科学发展!
扫一扫,反馈当前页面
和元生物