预测处理：大脑是一台预测机器？

🟡 活跃争论 · 📅 2026年3月 · ⏱ 阅读约15分钟

📑 本文目录

大脑不是照相机
预测机器的工作原理
实验如何检验它
从感知到行动、情绪与自我
哲学争议：这个框架是否太贪心？
诚实的边界
预测的囚笼，还是智慧的引擎？
参考文献

大脑不是照相机

我们通常以为感知是这样运作的：光子打到视网膜，信号传入大脑，意识如实”看见”外部世界。这是一种直觉上极为诱人的图景——被动接收，如实还原。

但这个图景几乎肯定是错的。

从颅骨包裹的黑暗中，大脑永远无法”直接”接触外部世界。它收到的只是神经信号——来自眼睛、耳朵、皮肤的电化学脉冲，本身并不携带”这是一张桌子”或”这是朋友的声音”这样的标签。那么，大脑怎么知道外面有什么？

预测处理框架（Predictive Processing，PP）给出了一个激进的答案：大脑不是照相机，而是预测机器。它持续生成关于世界状态的假说，将感知数据与预测做比较，只有当两者出现差异时，才更新内部模型。感知不是被动接收，而是主动推断。^[4]

这个想法并不新鲜。康德早就提醒我们，经验总是经过先天形式的塑造；贝叶斯统计为不确定条件下的推断提供了数学语言。^[3] 但在过去二十年，从神经科学到人工智能，这一框架被赋予了空前的雄心——也引发了空前的争议。

预测机器的工作原理

预测处理的核心直觉可以用一句话概括：大脑持续用”自上而下”的预测压制”自下而上”的感觉输入，只允许预测误差向上传播。

1999年，Rao 和 Ballard 在视觉皮层研究中正式提出这一机制：高层皮层区向低层区发送预测信号，低层区只回传未被预测吻合的”残差”——即预测误差（prediction error）。^[6] 这一”层级误差回传”图景成为现代 PP 的神经实现基础。

Karl Friston 走得更远。他用变分自由能（variational free energy）这一概念将整个框架数学化：生物体的根本驱动，是最小化内部模型与感知数据之间的”惊异”（surprise），在数学上等价于最小化自由能。^[1]

用人话说：大脑有一张关于世界的”内部地图”，它会不断问自己：如果地图是对的，我应该收到什么信号？收到的信号和预期不一样的部分，才值得专门处理。大脑的目标，是让这张地图尽可能准确——不是通过被动等待现实”写入”，而是主动猜，主动校正。

注意力在这里获得了一个优雅的解释：注意不是把光束打向某个目标，而是对特定通道的预测误差信号赋予更高的精度权重（precision weighting）。当你凝神倾听细雨，你实际上在告诉大脑：来自听觉通道的误差值得更认真对待。^[11]

实验如何检验它

框架再漂亮，终须接受数据的考问。近年实证研究正在把 PP 从哲学猜想推向可检验的科学模型。

🔬 语言理解中的双重机制

一项 2025 年发表于 PLoS Biology 的研究表明，语言理解中存在两种并行的预测机制：感官层面的”锐化”（sensory sharpening）与语义层面的预测误差更新。这项证据有助于调和此前相互竞争的不同 PP 子模型。^[12]

🔬 预测误差并非铁板一块

2025 年发表于 Imaging Neuroscience 的研究精细区分了不同特征维度上的预测误差信号，表明”预测误差”并非单一的全局量，而是依赖于层级、特征类型与任务背景。这支持 PP 作为一族可细化检验的模型，而非一个粗糙的口号。^[13]

🔬 注意是经典误差信号的必要条件

2023 年一项研究（PLoS Biology）显示，尽管刺激可以被早期编码，但脑电中经典的预测误差签名依赖注意资源才能出现。这意味着预测处理与注意机制深度耦合，并为”精度加权”理论提供了经验支持。^[14]

这些实证进展令人鼓舞，但也需要谨慎解读：神经影像中的”误差信号”未必与 PP 理论中的数学量直接对应，实验操作与理论概念之间总有诠释空档。

从感知到行动、情绪与自我

PP 的雄心不止于解释感知。支持者相信，它能统一认知科学的多个核心问题。

行动：主动采样，而非被动反应

Andy Clark 在其 2013 年的经典综述中指出，行动可以被理解为大脑用来实现预测的另一种手段。^[4] 如果你预测”我的手会握住杯子”，而手真的握住了，那预测就被满足了——不是通过更新信念，而是通过改变世界。他的 2016 年专著《冲浪不确定性》（Surfing Uncertainty）进一步发展了这一”主动推断”（active inference）图景：有机体是主动采样证据的代理，而非被动等待刺激的接收器。^[5]

Parr、Pezzulo 和 Friston 在 2022 年将主动推断发展为更具体的过程理论：感知、学习、策略选择和运动执行，都可以被统一为不同时间尺度上的信念更新。^[9]

情绪：对身体预测误差的解读

PP 框架正在渗透情绪科学。2022 年一项研究（Journal of Affective Disorders）表明，抑郁症患者在负性情境后呈现异常的预测误差更新模式——过度放大负面信号，难以从正面预期中获益。^[16] 这为情绪障碍的认知机制提供了一个 PP 视角的解释路径。

元认知与自我感：谁在做预测？

2024 年一项综述（Perspectives on Psychological Science）将”元认知感受”——如熟悉感、困难感、确信度——纳入 PP 框架，认为这些高阶感受本身也是预测误差驱动的信号。^[15]

Sandved-Smith、Friston 等人的工作则走向更深处：自我模型可能就是主动推断系统对自身状态的深层预测。^[20] 在这个图景中，”我”并不是一个固定的实体，而是大脑用来预测自身未来状态的动态模型——一种便于生存的叙事性构造。

这是令人眩晕的想法。如果”我”是预测的产物，那么谁在做预测？

哲学争议：这个框架是否太贪心？

⚖️ 核心争议

支持：统一的解释力

PP 的支持者认为，它提供了认知科学罕见的统一框架——感知、注意、行动、情绪、自我，都能在同一套数学语言下得到说明。从神经实现（层级皮层架构）到哲学含义（主动推断代理）的连贯性，使其成为迄今最有解释野心的认知理论。Ramstead、Kirchhoff 和 Friston 在 2020 年的综述中系统论证了从生物学到认知的跨层级一致性。^[8]

反对：过度泛化与可证伪性

批评者的核心忧虑是：如果一个框架能解释一切，它是否实际上什么都没解释？2025 年发表于 Noûs 的哲学论文尖锐指出，某些 PP 叙述悄然滑向”先验唯心论”——世界被构建为心智活动的产物，而非独立存在的客观实在。这种形而上学承诺远超 PP 作为计算框架应有的范围。^[18]

Dołęga 和 Miłkowski 在 Synthese（2020）的论文中采取了一种更为温和的立场：PP 对意识问题的解释应保持”弱解释”态度，不宜把它奉为意识的终极理论。^[17] 他们的担忧恰好针对 PP 的一个诱人危险：一个框架越是优雅，就越容易诱使人们把它的适用边界无限延伸。

表征之争：PP 是否消解了”心理表征”？

PP 框架内部还存在一场关于表征地位的争论。强版本的 PP 有时被解读为：大脑不需要”表征”世界，只需维持一套生成模型不断与感知数据”博弈”——表征消失于过程之中。

Gong 等人在 2025 年的论文（Cultures of Science）中为 PP 中的”适应性表征”辩护，认为表征概念并未被消解，而是以更灵活、更动态的形式保留下来。^[19] 这场争论反映了认知科学中更深的断层：我们究竟需要什么样的表征概念？

Hohwy 从现象学与认知科学交叉的视角指出，PP 对意识与自我的讨论必须在本体论层面保持清醒，区分”形式推断工具”与”存在论承诺”。^[10]

诚实的边界

作为一篇哲学反思型文章，我们有义务正视 PP 框架的已知局限：

数学框架的解释模糊性：自由能原理在数学上非常一般，以至于几乎任何自适应系统都可以被描述为”最小化自由能”——这可能使它失去判别力。^[1]
神经实现的细节仍不明朗：层级误差信号在皮层架构中的具体实现方式——哪些神经元编码预测，哪些编码误差——远未形成共识。^[7]
可证伪性边界：“预测处理”有时指一组具体的可检验模型，有时指更广泛的计算原则——两者的证伪条件截然不同。^[2]
进化与发育机制尚待整合：大脑如何在个体发育中习得初始的先验分布？PP 框架目前对这个问题的回答仍不完整。

承认这些局限，并不削弱 PP 的价值——恰恰相反，这正是科学框架应有的诚实姿态。

预测的囚笼，还是智慧的引擎？

让我们回到最开始的问题：大脑是一台预测机器吗？

如果这个问题的意思是”大脑是否在生成内部模型，并用它来约束感知”——那么答案几乎肯定是肯定的，有相当充分的神经科学证据支持。^[6][12][14]

如果问题是”PP 是否提供了一个完整的心智理论，足以解释意识、自我和主体性”——那答案远未确定，值得保持审慎。

但 PP 框架最深刻的哲学含义或许在这里：它迫使我们重新思考”客观性”的含义。如果每一次感知都是先验与数据的融合，如果我们所看到的世界部分由我们自己的模型塑造——那”客观看待世界”是否只是一种幻觉？

这不是新问题。康德问过，胡塞尔问过，梅洛-庞蒂问过。PP 的贡献在于，它把这个问题从哲学书斋带进了神经科学实验室，并给出了一个可操作化的数学语言。这本身已是相当了不起的成就。

🔭 万象点评

预测处理框架是近二十年认知科学最具野心的统一尝试。它的力量在于：用一套数学语言——变分自由能——同时说明感知、行动、注意和情绪，这在此前几乎没有先例。但”统一”从来都是双刃剑：越是无所不包，就越容易滑向不可证伪。我们的判断是——PP 作为研究纲领（research programme）极有价值，它在重新组织实验设计、驱动跨学科对话方面已经产生了真实成果；但将它直接等同于”大脑的工作原理”，则为时尚早。最诚实的姿态或许是：把它当作目前最好用的地图，同时记住地图不是疆域。

💡 核心要点

预测处理框架主张大脑通过生成预测、比对误差来推断世界状态，而非被动接收感觉输入
自由能原理为这一框架提供了数学统一性，将感知、行动、注意纳入同一形式语言
近年实证研究正在把 PP 从原则推向可细化检验的模型族，但神经实现细节仍有争议
PP 框架的解释野心延伸到行动、情绪、自我模型，但过度泛化的风险真实存在
最诚实的立场：PP 是极具启发力的研究纲领，而非已完成的心智理论

参考文献

[1] Friston K. The free-energy principle: a unified brain theory? Nature Reviews Neuroscience, 2010. DOI:10.1038/nrn2787
[2] Hohwy J, Dayan P. Does predictive coding have a future? Nature Reviews Neuroscience, 2012. DOI:10.1038/nrn3137
[3] Kording KP, Wolpert DM. The Bayesian brain: the role of uncertainty in neural coding and computation. Trends in Cognitive Sciences, 2004. DOI:10.1016/j.tics.2004.11.005
[4] Clark A. Whatever next? Predictive brains, situated agents, and the future of cognitive science. Behavioral and Brain Sciences, 2013. DOI:10.1017/S0140525X12000477
[5] Clark A. Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford University Press, 2016. DOI:10.1093/acprof:oso/9780190217013.001.0001
[6] Rao RP, Ballard DH. Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience, 1999. DOI:10.1038/4580
[7] Friston K. A theory of cortical responses. Philosophical Transactions B, 2005. DOI:10.1098/rstb.2005.1622
[8] Ramstead MJD, Kirchhoff M, Friston K. The free-energy principle from biology to cognition: a review. Cortex, 2020. DOI:10.1016/j.cortex.2020.08.009
[9] Parr T, Pezzulo G, Friston K. Active inference: a process theory. Neural Computation, 2022. DOI:10.1162/neco_a_01199
[10] Hohwy J. Predictive processing and the free-energy principle: new perspectives on cognition and consciousness. Phenomenology and the Cognitive Sciences, 2013. DOI:10.1007/s11097-013-9320-5
[11] Feldman H, Friston K. Attention, uncertainty, and free-energy. Frontiers in Human Neuroscience, 2010. DOI:10.3389/fnhum.2010.00215
[12] Schneider F et al. Sensory sharpening and semantic prediction errors unify competing models of predictive processing in human speech comprehension. PLoS Biology, 2025. PMID:41512013
[13] Richter D et al. Feature-specific predictive processing: What’s in a prediction error? Imaging Neuroscience, 2025. PMID:41425257
[14] Male AG et al. Attention is required for canonical brain signature of prediction error despite early encoding of the stimuli. PLoS Biology, 2023. PMID:37339145
[15] Fernández Velasco P et al. Metacognitive feelings: a predictive-processing perspective. Perspectives on Psychological Science, 2024. PMID:38285929
[16] Ramos-Grille I et al. Predictive processing in depression: Increased prediction error following negative valence contexts. Journal of Affective Disorders, 2022. PMID:35550829
[17] Dołęga K, Miłkowski M. Fame in the predictive brain: a deflationary approach to explaining consciousness in the prediction error minimization framework. Synthese, 2020. DOI:10.1007/s11229-019-02432-7
[18] Schlicht T et al. Predictive processing’s flirt with transcendental idealism. Noûs, 2025. DOI:10.1111/nous.12505
[19] Gong Z, Wei Y. An adaptive representational account of predictive processing in human cognition. Cultures of Science, 2025. DOI:10.1177/20966083251324230
[20] Sandved-Smith L, Hesp C, Mattout J, Friston K et al. Consciousness in active inference: Deep self-models, other minds, and the challenge of psychedelic-induced ego-dissolution. Neuroscience of Consciousness, 2021. DOI:10.1093/nc/niab024