跳至正文

预测处理:大脑是一台预测机器?

🟡 活跃争论 · 📅 2026年3月 · ⏱ 阅读约15分钟
📑 本文目录

大脑不是照相机

我们通常以为感知是这样运作的:光子打到视网膜,信号传入大脑,意识如实”看见”外部世界。这是一种直觉上极为诱人的图景——被动接收,如实还原。

但这个图景几乎肯定是错的。

从颅骨包裹的黑暗中,大脑永远无法”直接”接触外部世界。它收到的只是神经信号——来自眼睛、耳朵、皮肤的电化学脉冲,本身并不携带”这是一张桌子”或”这是朋友的声音”这样的标签。那么,大脑怎么知道外面有什么?

预测处理框架(Predictive Processing,PP)给出了一个激进的答案:大脑不是照相机,而是预测机器。它持续生成关于世界状态的假说,将感知数据与预测做比较,只有当两者出现差异时,才更新内部模型。感知不是被动接收,而是主动推断。[4]

这个想法并不新鲜。康德早就提醒我们,经验总是经过先天形式的塑造;贝叶斯统计为不确定条件下的推断提供了数学语言。[3] 但在过去二十年,从神经科学到人工智能,这一框架被赋予了空前的雄心——也引发了空前的争议。

预测机器的工作原理

预测处理的核心直觉可以用一句话概括:大脑持续用”自上而下”的预测压制”自下而上”的感觉输入,只允许预测误差向上传播。

1999年,Rao 和 Ballard 在视觉皮层研究中正式提出这一机制:高层皮层区向低层区发送预测信号,低层区只回传未被预测吻合的”残差”——即预测误差(prediction error)。[6] 这一”层级误差回传”图景成为现代 PP 的神经实现基础。

Karl Friston 走得更远。他用变分自由能(variational free energy)这一概念将整个框架数学化:生物体的根本驱动,是最小化内部模型与感知数据之间的”惊异”(surprise),在数学上等价于最小化自由能。[1]

用人话说:大脑有一张关于世界的”内部地图”,它会不断问自己:如果地图是对的,我应该收到什么信号?收到的信号和预期不一样的部分,才值得专门处理。大脑的目标,是让这张地图尽可能准确——不是通过被动等待现实”写入”,而是主动猜,主动校正。

注意力在这里获得了一个优雅的解释:注意不是把光束打向某个目标,而是对特定通道的预测误差信号赋予更高的精度权重(precision weighting)。当你凝神倾听细雨,你实际上在告诉大脑:来自听觉通道的误差值得更认真对待。[11]

实验如何检验它

框架再漂亮,终须接受数据的考问。近年实证研究正在把 PP 从哲学猜想推向可检验的科学模型。

🔬 语言理解中的双重机制

一项 2025 年发表于 PLoS Biology 的研究表明,语言理解中存在两种并行的预测机制:感官层面的”锐化”(sensory sharpening)与语义层面的预测误差更新。这项证据有助于调和此前相互竞争的不同 PP 子模型。[12]

🔬 预测误差并非铁板一块

2025 年发表于 Imaging Neuroscience 的研究精细区分了不同特征维度上的预测误差信号,表明”预测误差”并非单一的全局量,而是依赖于层级、特征类型与任务背景。这支持 PP 作为一族可细化检验的模型,而非一个粗糙的口号。[13]

🔬 注意是经典误差信号的必要条件

2023 年一项研究(PLoS Biology)显示,尽管刺激可以被早期编码,但脑电中经典的预测误差签名依赖注意资源才能出现。这意味着预测处理与注意机制深度耦合,并为”精度加权”理论提供了经验支持。[14]

这些实证进展令人鼓舞,但也需要谨慎解读:神经影像中的”误差信号”未必与 PP 理论中的数学量直接对应,实验操作与理论概念之间总有诠释空档。

从感知到行动、情绪与自我

PP 的雄心不止于解释感知。支持者相信,它能统一认知科学的多个核心问题。

行动:主动采样,而非被动反应

Andy Clark 在其 2013 年的经典综述中指出,行动可以被理解为大脑用来实现预测的另一种手段。[4] 如果你预测”我的手会握住杯子”,而手真的握住了,那预测就被满足了——不是通过更新信念,而是通过改变世界。他的 2016 年专著《冲浪不确定性》(Surfing Uncertainty)进一步发展了这一”主动推断”(active inference)图景:有机体是主动采样证据的代理,而非被动等待刺激的接收器。[5]

Parr、Pezzulo 和 Friston 在 2022 年将主动推断发展为更具体的过程理论:感知、学习、策略选择和运动执行,都可以被统一为不同时间尺度上的信念更新。[9]

情绪:对身体预测误差的解读

PP 框架正在渗透情绪科学。2022 年一项研究(Journal of Affective Disorders)表明,抑郁症患者在负性情境后呈现异常的预测误差更新模式——过度放大负面信号,难以从正面预期中获益。[16] 这为情绪障碍的认知机制提供了一个 PP 视角的解释路径。

元认知与自我感:谁在做预测?

2024 年一项综述(Perspectives on Psychological Science)将”元认知感受”——如熟悉感、困难感、确信度——纳入 PP 框架,认为这些高阶感受本身也是预测误差驱动的信号。[15]

Sandved-Smith、Friston 等人的工作则走向更深处:自我模型可能就是主动推断系统对自身状态的深层预测。[20] 在这个图景中,”我”并不是一个固定的实体,而是大脑用来预测自身未来状态的动态模型——一种便于生存的叙事性构造。

这是令人眩晕的想法。如果”我”是预测的产物,那么谁在做预测?

哲学争议:这个框架是否太贪心?

⚖️ 核心争议

支持:统一的解释力

PP 的支持者认为,它提供了认知科学罕见的统一框架——感知、注意、行动、情绪、自我,都能在同一套数学语言下得到说明。从神经实现(层级皮层架构)到哲学含义(主动推断代理)的连贯性,使其成为迄今最有解释野心的认知理论。Ramstead、Kirchhoff 和 Friston 在 2020 年的综述中系统论证了从生物学到认知的跨层级一致性。[8]

反对:过度泛化与可证伪性

批评者的核心忧虑是:如果一个框架能解释一切,它是否实际上什么都没解释?2025 年发表于 Noûs 的哲学论文尖锐指出,某些 PP 叙述悄然滑向”先验唯心论”——世界被构建为心智活动的产物,而非独立存在的客观实在。这种形而上学承诺远超 PP 作为计算框架应有的范围。[18]

Dołęga 和 Miłkowski 在 Synthese(2020)的论文中采取了一种更为温和的立场:PP 对意识问题的解释应保持”弱解释”态度,不宜把它奉为意识的终极理论[17] 他们的担忧恰好针对 PP 的一个诱人危险:一个框架越是优雅,就越容易诱使人们把它的适用边界无限延伸。

表征之争:PP 是否消解了”心理表征”?

PP 框架内部还存在一场关于表征地位的争论。强版本的 PP 有时被解读为:大脑不需要”表征”世界,只需维持一套生成模型不断与感知数据”博弈”——表征消失于过程之中。

Gong 等人在 2025 年的论文(Cultures of Science)中为 PP 中的”适应性表征”辩护,认为表征概念并未被消解,而是以更灵活、更动态的形式保留下来。[19] 这场争论反映了认知科学中更深的断层:我们究竟需要什么样的表征概念?

Hohwy 从现象学与认知科学交叉的视角指出,PP 对意识与自我的讨论必须在本体论层面保持清醒,区分”形式推断工具”与”存在论承诺”。[10]

诚实的边界

作为一篇哲学反思型文章,我们有义务正视 PP 框架的已知局限:

  • 数学框架的解释模糊性:自由能原理在数学上非常一般,以至于几乎任何自适应系统都可以被描述为”最小化自由能”——这可能使它失去判别力。[1]
  • 神经实现的细节仍不明朗:层级误差信号在皮层架构中的具体实现方式——哪些神经元编码预测,哪些编码误差——远未形成共识。[7]
  • 可证伪性边界:“预测处理”有时指一组具体的可检验模型,有时指更广泛的计算原则——两者的证伪条件截然不同。[2]
  • 进化与发育机制尚待整合:大脑如何在个体发育中习得初始的先验分布?PP 框架目前对这个问题的回答仍不完整。

承认这些局限,并不削弱 PP 的价值——恰恰相反,这正是科学框架应有的诚实姿态。

预测的囚笼,还是智慧的引擎?

让我们回到最开始的问题:大脑是一台预测机器吗?

如果这个问题的意思是”大脑是否在生成内部模型,并用它来约束感知”——那么答案几乎肯定是肯定的,有相当充分的神经科学证据支持。[6][12][14]

如果问题是”PP 是否提供了一个完整的心智理论,足以解释意识、自我和主体性”——那答案远未确定,值得保持审慎。

但 PP 框架最深刻的哲学含义或许在这里:它迫使我们重新思考”客观性”的含义。如果每一次感知都是先验与数据的融合,如果我们所看到的世界部分由我们自己的模型塑造——那”客观看待世界”是否只是一种幻觉?

这不是新问题。康德问过,胡塞尔问过,梅洛-庞蒂问过。PP 的贡献在于,它把这个问题从哲学书斋带进了神经科学实验室,并给出了一个可操作化的数学语言。这本身已是相当了不起的成就。

🔭 万象点评

预测处理框架是近二十年认知科学最具野心的统一尝试。它的力量在于:用一套数学语言——变分自由能——同时说明感知、行动、注意和情绪,这在此前几乎没有先例。但”统一”从来都是双刃剑:越是无所不包,就越容易滑向不可证伪。我们的判断是——PP 作为研究纲领(research programme)极有价值,它在重新组织实验设计、驱动跨学科对话方面已经产生了真实成果;但将它直接等同于”大脑的工作原理”,则为时尚早。最诚实的姿态或许是:把它当作目前最好用的地图,同时记住地图不是疆域。

💡 核心要点

  • 预测处理框架主张大脑通过生成预测、比对误差来推断世界状态,而非被动接收感觉输入
  • 自由能原理为这一框架提供了数学统一性,将感知、行动、注意纳入同一形式语言
  • 近年实证研究正在把 PP 从原则推向可细化检验的模型族,但神经实现细节仍有争议
  • PP 框架的解释野心延伸到行动、情绪、自我模型,但过度泛化的风险真实存在
  • 最诚实的立场:PP 是极具启发力的研究纲领,而非已完成的心智理论

参考文献

  • [1] Friston K. The free-energy principle: a unified brain theory? Nature Reviews Neuroscience, 2010. DOI:10.1038/nrn2787
  • [2] Hohwy J, Dayan P. Does predictive coding have a future? Nature Reviews Neuroscience, 2012. DOI:10.1038/nrn3137
  • [3] Kording KP, Wolpert DM. The Bayesian brain: the role of uncertainty in neural coding and computation. Trends in Cognitive Sciences, 2004. DOI:10.1016/j.tics.2004.11.005
  • [4] Clark A. Whatever next? Predictive brains, situated agents, and the future of cognitive science. Behavioral and Brain Sciences, 2013. DOI:10.1017/S0140525X12000477
  • [5] Clark A. Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford University Press, 2016. DOI:10.1093/acprof:oso/9780190217013.001.0001
  • [6] Rao RP, Ballard DH. Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience, 1999. DOI:10.1038/4580
  • [7] Friston K. A theory of cortical responses. Philosophical Transactions B, 2005. DOI:10.1098/rstb.2005.1622
  • [8] Ramstead MJD, Kirchhoff M, Friston K. The free-energy principle from biology to cognition: a review. Cortex, 2020. DOI:10.1016/j.cortex.2020.08.009
  • [9] Parr T, Pezzulo G, Friston K. Active inference: a process theory. Neural Computation, 2022. DOI:10.1162/neco_a_01199
  • [10] Hohwy J. Predictive processing and the free-energy principle: new perspectives on cognition and consciousness. Phenomenology and the Cognitive Sciences, 2013. DOI:10.1007/s11097-013-9320-5
  • [11] Feldman H, Friston K. Attention, uncertainty, and free-energy. Frontiers in Human Neuroscience, 2010. DOI:10.3389/fnhum.2010.00215
  • [12] Schneider F et al. Sensory sharpening and semantic prediction errors unify competing models of predictive processing in human speech comprehension. PLoS Biology, 2025. PMID:41512013
  • [13] Richter D et al. Feature-specific predictive processing: What’s in a prediction error? Imaging Neuroscience, 2025. PMID:41425257
  • [14] Male AG et al. Attention is required for canonical brain signature of prediction error despite early encoding of the stimuli. PLoS Biology, 2023. PMID:37339145
  • [15] Fernández Velasco P et al. Metacognitive feelings: a predictive-processing perspective. Perspectives on Psychological Science, 2024. PMID:38285929
  • [16] Ramos-Grille I et al. Predictive processing in depression: Increased prediction error following negative valence contexts. Journal of Affective Disorders, 2022. PMID:35550829
  • [17] Dołęga K, Miłkowski M. Fame in the predictive brain: a deflationary approach to explaining consciousness in the prediction error minimization framework. Synthese, 2020. DOI:10.1007/s11229-019-02432-7
  • [18] Schlicht T et al. Predictive processing’s flirt with transcendental idealism. Noûs, 2025. DOI:10.1111/nous.12505
  • [19] Gong Z, Wei Y. An adaptive representational account of predictive processing in human cognition. Cultures of Science, 2025. DOI:10.1177/20966083251324230
  • [20] Sandved-Smith L, Hesp C, Mattout J, Friston K et al. Consciousness in active inference: Deep self-models, other minds, and the challenge of psychedelic-induced ego-dissolution. Neuroscience of Consciousness, 2021. DOI:10.1093/nc/niab024