认知表征到底是什么？Is the FEP a Formal Theory of Semantics?representation

CreateAMind

发布于 2024-02-26 17:11:31

1080

发布于 2024-02-26 17:11:31

文章被收录于专栏：CreateAMindCreateAMind

摘要

本文的目的有两个：（1）评估神经表征的构造在变分自由能原理及其推论过程理论、主动推理下是否发挥解释作用；（2）如果是这样，评估哪种哲学立场相对于表征的本体论和认识论地位是最合适的。我们专注于非现实主义（紧缩和虚构主义‑工具主义）方法。我们考虑对心理表征的紧缩解释，根据这种解释，神经表征的解释性相关内容是数学的，而不是认知的；以及虚构主义或工具主义的解释，根据这种表征是服务于解释（和其他）目标的科学上有用的虚构。在回顾了自由能原理和主动推理之后，我们认为自由能原理下的自适应表型模型可以用来提供形式语义，使我们能够将语义内容分配给特定的表型状态（一个表型的内部状态）远离平衡的马尔可夫系统）。我们提出了一种修改后的虚构主义解释以有机体为中心的虚构主义或工具主义。我们认为，在自由能原则下，即使对神经表征的内容进行紧缩解释，也可以诉诸认知系统的“关于性”或意向性中涉及的语义内容；因此，我们的立场与现实主义立场是一致的，但又基于与现实主义立场不同的假设。我们认为，自由能原理因此解释了生命系统中的有关性或意向性，以及它们使用本体论或一组语义因素解析其感官流的能力。

关键词：变分自由能原理；主动推理；神经表征；代表性主义；工具主义；通缩的

核心是第四节，其他部分有铺垫，有历史，有分析，有批判等

1. Introduction: Neural Representations and Their (Dis)Contents

简介:神经表征及其内容

‍

代表在一些人类事务中占有重要地位。人类通常使用地图等代表性物品来导航他们的环境。地图代表了要穿越的地形，智能体能够读取它并利用它包含的信息来指导他们的行为。毫无疑问，人类有意识地、有意识地从事智力任务，例如对因果关系进行理论分析，这需要在心理上思考情况和事态的能力。我们大多数人都能在脑海中看到情况过去的、可能的和虚构的，通过想象和心理意象，传统上是根据表征能力来塑造的。

在认知科学、神经科学和心灵哲学中，表征的概念已被用来尝试自然地解释“关于性”或“意向性”的基本属性如何在生命系统中出现[1]。事实上，生物必须与它们所处的世界相互作用，并且必须区分与其生存相关的环境特征和其他生物体。生物的行为就好像它们对世界、对它的结构和它的居民有信念一样，这些信念指导着它们的决策过程，特别是在产生适应性行动方面。因此，对于任何必须进行概率推理以支持其在不确定世界中的决策的系统来说，这种关于性的属性是一个基础属性，这也是本文所讨论的特殊问题的核心。

在这种情况下，提供自然主义解释就是通过诉诸物理过程来解释某些现象[2]。认知科学采用的策略是通过假设主体内部存在携带、编码或以其他方式承载语义内容的物理结构来自然化意向性。经典的叙述包括 Fodor [3]、Millikan [4,5]。

在研究心灵的科学和哲学中，表征通常被定义为一些携带语义内容的内部载体神经表征[6]。因此，表征是有机体内部的物理结构。通常，状态和过程在他们的大脑中展开，携带或编码表征内容。神经表征发挥的认知作用是解释生物如何能够参与其环境的相关特征并计划适合情境的适应性行为[6,7]。表征的语义内容是表征的内容，它处于一种有意的关系中 “凭借它们所代表的内容，他们所做的事情，或者‘关于’他们所关心的事情” （[8 ]，第 2390 页）。指定语义内容的性质和起源的问题被称为内容难题[9,10]。

对于代表性解释的适当性，有几个公认的限制：这样的解释应该（1）与计算认知科学研究中使用的实际实践广泛一致； (2) 允许虚假陈述，即陈述必须能够“弄错”；（3）提供将确定的内容归因于特定状态或结构（通常在系统内部）的原则方法，最后（4）是自然主义的，这意味着在定义如何进行时，语义内容的说明本身并不诉诸语义术语表征能力是通过物理系统实现的，但存在推理中的循环性[11,12]。

一个基本而棘手的问题是，是否存在某种表征结构不仅适用于所有情况（即神经表征的构造以及我们更熟悉的、有意的日常表征活动），而且还真正解释了意向关系生物与其环境之间。同样棘手的问题涉及神经表征的本体论和认识论地位：这样的东西真的存在吗？它们有解释价值吗？本文的目的是双重的。首先，我们的目的是确定神经表征的构造是否在日益流行的生命系统行为和认知研究框架中发挥解释作用，即变分自由能原理及其推论过程理论、主动推理。其次，如果神经表征的假设在自由能原理下得到保证，我们的目标是评估关于表征的本体论和认识论状态的现有哲学立场中哪些最适合该框架下的构造。由于要确定的问题不能仅仅通过诉诸形式框架来决定，因此我们首先讨论表征主义问题。

在第一节的剩余部分中，我们回顾了有关表征主义的问题。在第二部分中，我们提出并激发了自由能原理下大脑的观点，即大脑作为一个被统计边界（称为马尔可夫毯）包围的自组织非平衡稳态。在下一节中，我们考虑神经表征的非现实主义解释：

通货紧缩的解释，根据该解释，神经表征的内容是数学的；以及虚构主义的解释，根据该表征是科学上有用的虚构。在第四部分中，我们建议将这两种解释的各个方面结合起来，产生一种细致入微的现实主义解释，它正式定义了表征的语义内容人们可以称之为对神经表征的紧缩的、以有机体为中心的虚构主义解释。我们认为，即使在自由能原则下追求对神经表征内容的极简主义、通货紧缩的解释，也可以诉诸一种强大的语义内容，这种语义内容在认知系统的“关于性”或意向性中处于危险之中。随后的立场与现实主义立场广泛一致，但基于与现实主义立场不同的假设。

1.1. The Faces of Representationalism: Realism and Non-Realism

1.1.具象主义的面貌：现实主义与非现实主义

粗略地说，在心灵哲学中，有两种主要方式来思考神经表征构造的本体论状态，这对现有的认识论立场具有影响。一是神经表征的现实主义。这种观点结合了两种立场：在本体论上，神经表征确实存在（通常，它们在大脑中物理实例化）；在本体论上，神经表征确实存在（通常，它们在大脑中物理实例化）。从认识论上看，它们也是科学上有用的假设[6,13]。非现实主义立场也是可用的，它们不共享所有这些假设。非现实主义者要么对神经表征的现实性不可知，要么明确拒绝这一假设。反实在论说神经表征不存在。非实在论有多种，它们具有不同的认识论含义。消除主义是一种反实在论观点，认为神经表征的构建应该从科学实践中消除[14,15]。工具主义或虚构主义是一种非现实主义观点，认为神经表征是有用的虚构：它们是描述世界的一种科学上有用的方式[11,12,16–19]。

为了弄清楚这些位置中哪一个最合适，回顾神经表示构造的不同版本是有用的。神经表征的经典观点将它们视为由大脑状态实现并由规则控制过程操纵的符号结构。这是根据心灵计算理论[3]得出的，根据该理论，认知是对类似符号的内部认知结构（即神经表征）的规则控制的操纵。在这些经典的叙述中，表征的内容要么通过诉诸固有的概念和机制来确定，以确保所表征内容的准确性和客观性[3,20]；要么通过利用固有的概念和机制来确定表征的内容[3,20]。通过生物固有功能的作用来解释内容[21‑23]；或者通过提及我们对世界上事物的第一人称体验的现象内容[24,25]。所有这些帐户都有一个共同点，即神经表征的构造作为内部符号（或类型），在适当的情况下被实例化（或标记）；不同的是适当性条件的实施方式。心灵计算理论也有非表征版本，我们在这里不关心它们；参见米尔科夫斯基[26]；皮奇尼尼[27]。

在并行分布式处理的推动下，神经表征的联结主义模型与经典方法的支持者在表征载体的本质上存在分歧。

但同意大脑利用内部认知结构作为内容的载体[28,29]。

联结主义者认为神经表征不是离散的符号结构，而是分布式表征。也就是说，它们通过其活动的联合配置来履行代表事态的职能。

今天，最流行的（在我们看来，也是最引人注目的）表征主义叙述属于联结主义类型。他们将神经表征转化为结构表征。因此，神经表示能够表示其目标域（即，对有关其目标域的语义内容进行编码），因为它们的神经车辆编码与目标域共享的可利用的结构相似性[8,30–32]。因此，表示的功能很像地图：它们概括了该领域的高阶结构特征，例如其统计特性；另见[33]。更具体地说，结构表示以有机体可以利用的格式编码信息来指导其行为，可以提供错误检测（即提供误传），并且可以用于“离线”导航[8,32,34–36]。结构表征通过“大脑中内部表征的结构复制生成过程的结构（感官输入通过该生成过程影响大脑）”的过程来形象地运作（[31]， p.1962 ）。

1.2. Towards Anti-Realism: Deficiencies of the Realist View

1.2.走向反现实主义：现实主义观点的缺陷

认知科学和神经科学的大多数研究都默认基于关于神经表征和设计实验的现实主义假设，旨在解释我们对世界的体验和行动是如何由大脑网络中编码的结构化知识体介导的。神经表征的存在和解释价值是几乎所有心理学教科书的基本前提。例如，人们可以在《麻省理工学院认知科学百科全书》中读到： “心理学是研究信息表示和处理的科学” （[37]， p.xl，强调部分已添加）。

尽管关于心理表征的现实主义是大多数认知科学和神经科学的默认操作模式，但这并不是共识立场。采用反现实主义、反表象主义方法的动机来自于这样的观察：尽管付出了巨大的努力和科学投资，表象尚未自然化[6,9,38‑42]。这尤其是因为现有的阐明神经表征理论的尝试迄今为止未能提供一种语义内容的自然主义理论，该理论不预设它试图解释的非常有意的关系和表征内容，从而确保了上面讨论的第（4）点。因此，拉姆齐[43]等学者呼吁谨慎使用该概念。他们认为，对语义内容的诉求通常是一种哲学注释，不会增加任何解释价值：

“常识心理学提供的角色是区分不同类型的心理表征。更一般地说，我们需要但常识心理学没有提供的是那种使某物成为表征状态（时期）的身体条件。从功能上来说，我们想知道不同类型的表示可能有什么共同点，即表示。常识心理学和计算主义都没有告诉我们太多关于赋予大脑状态代表功能的因果/物理条件（至少不是直接的）。” （[43]，第 6 页，强调）

在文献中，很常见的是神经组织对给定刺激的选择性反应被描述为刺激的表示或编码。这种概念化被应用于感知研究，特别是为了强调细胞在检测感知对象的某些特征方面的专业化[44‑48]；以及记忆[49,50]和运动活动[51‑53]的研究。然而，正如 Ramsey [6]指出的那样，响应选择性本身无法使物理状态成为一种表征。许多物理状态具有响应选择性，但不是表征。例如，一个人的皮肤状态会随着天气的变化而变化（例如，暴露在阳光下的次数越多，颜色就越深），但我们不会（直观地）将一个人的皮肤视为太阳或天气的代表。

我们发现生物科学和神经科学的方法不太致力于将认知视为发生在大脑边界内的表征过程[54‑58]。这些观点包括知觉和运动控制理论[59,60]；机器人技术[61]；控制论[62‑65]；以及，可以说，自由能原理和主动推理[56,57,66]。这些解释通常来自认知科学中的体现和主动方法[14,67‑70]，集中在这样一个观点上：认知的主要目标不是在内部重建隐藏世界结构的代理，而是适应并在环境中行动。

在这种情况下，Sprevak [17]建议似乎有两个选择。我们可以采取一个冷静的现实主义假设，即神经表征的自然化最终会成功。（尽管到目前为止还没有成功的解释。）另外，非现实主义（取消主义和虚构主义）淡化了认知科学中表征谈话的价值。非现实主义者观察到，如果不将神经元表征与认知过程混为一谈，就不可能定义它的内容：我们从科学实践中借用语义（以及表征的内容）。更准确地说，如果不借助我们对认知活动本身的了解就无法确定假定的表征内容，那么认知活动就具有解释力。相反，如果根据认知活动进行的解释就足够了，而无需诉诸实验者强加的语义，那么就没有理由假设表征内容。这可能会促使将神经表征的使用限制为“非正式的注释” [11,16]。

完全消除神经表征构造的代价是，它需要对认知科学中的主流表征范式进行痛苦的修正。事实上，我们通常求助于神经表征来解释目标导向的概率推理和决策。放弃这个假设让我们有义务放弃一些我们可以使用的最强大的解释工具。这是合法的吗？

1.3. Representations Under the Free-Energy Principle?

1.3.自由能原理下的表示？

更准确地说，本文的目的是贝叶斯神经科学中神经表征的地位，即自由能原理和主动推理。在贝叶斯神经科学中，大脑被视为一个统计器官或推理引擎，可以最大限度地减少其对世界状况的不确定性。在这个理论家族中，大脑被描述为通过利用有关其环境的概率知识来解释其受到轰击的感觉信号的可能原因[36,64,71,72]并采取行动来进行预测工作以带来其首选或预期的感官状态的方式[73,74]。

一些基于预测编码算法的贝叶斯方法用于描述皮层中的规范微电路，具有很强的代表性承诺[8,31,32,34–36,73,75]。这些说法认为贝叶斯大脑需要结构表征的假设。因此，神经表征被认为是内部的、类似地图的结构，它们在大脑网络中实例化并编码可利用的信息。

最近的几篇论文讨论了在自由能原理下是否有必要对神经表征进行现实主义解释[8,32,34,35,56]。除了一些值得注意的例外[76]，很少有论文试图根据自由能原理评估各种非实在论论证。在本文中，我们将认为，认真对待两种形式的非现实主义立场（紧缩主义和虚构主义观点）会导致现实主义的微妙形式，这种形式很容易为意向性研究提供自然主义基础。

为什么要关心表象的本体论和认识论地位？从我们的角度来看，这样做的一个主要原因是，一个人对表征状态的立场对计算神经科学研究有影响；确定哪些结构发挥表征作用，以及它们如何承载语义内容，对于神经科学的实践至关重要。一个突出的例子是人脑中的运动表征和运动命令[77,78]。计算神经科学中的表征主义框架假设大脑中存在代表运动任务的结构。最优控制理论是借用此类假设的更流行的建模框架之一。这种方法基于对大脑在运动控制中处理的模型和信号的性质的强烈假设。最佳控制的假设是，运动表征是编码执行任务的明确指令的大脑结构，并且根据内在坐标（即，根据肌肉纤维的收缩和拉伸）指定。然而，最优控制理论结构受到了批评，并且缺乏大脑中明确的类似指令的运动命令的经验证据。有关讨论，请参阅 Hipolito 等人。 [77]。我们的框架提供了表征能力的另一种表征，其不以类似指令的运动命令为前提。相反，我们将表征能力描述为由虚构状态的本体论所支撑，以及实现对感官数据的偏好的主动推理过程。我们对表征能力的紧缩观点消除了最优控制的有问题的表征假设，同时也揭示了语义内容是如何通过主动推理的历史获得的。

2. The Free-Energy Principle and Active Inference: From Information Geometry to the Physics of Phenotypes 自由能原理和主动推理：从信息几何到表型物理学

2.1. State Spaces, Nonequilibrium Dynamics, and Bears (Oh My)

我们的论文将重点关注著名的贝叶斯行动和认知理论、变分自由能原理及其推论，主动推理[66,79]。自由能原理始于对生物系统（如生物）具有表型的观察。活生物体保持其表型完整性，并抵抗与周围环境的热力学平衡趋势这通常是由概括热力学第二定律的涨落定理决定的[80,81]。生物体通过限制其组成状态的熵（分散或扩散）上限来实现这一点。为了更好地处理这个问题，在本节中，我们引入两个形式概念：状态空间和非平衡稳态。以下内容的简要技术处理可在附录A以及术语和表达术语表中找到。

在物理学中，平衡和非平衡是通过动力学演化的最终状态来区分的。当所有能量梯度都被消耗掉时，平衡动力学就会消失；在该点系统与其环境处于热力学平衡。对于生物来说，热力学平衡就是死亡。生物是远离平衡的开放系统。我们如何使用正式资源对此进行建模？

状态或相空间形式主义来自动力系统理论，使我们能够正式掌握生命系统的困境。状态或相空间是一个抽象空间，它允许我们根据系统可以发现的所有可能状态来对系统的时间演化进行建模。

为了构建状态空间，我们识别系统中可以变化的所有相关量（即所有相关变量），然后将每个变量绘制在抽象空间的维度上。这个空间称为状态空间。这个空间的每一个维度都对应着系统中的一个变量；由于我们为系统的每个变量分配了一个值，因此该空间中的一个点对应于系统的完整瞬时规范；即，我们在每个维度上为系统分配一个位置。

该空间中的轨迹又对应于系统状态随时间的流动。状态空间形式主义允许我们通过描述状态空间的轨迹来隐式地描述系统的时间演化。事实证明这一点至关重要。如果我们对系统可以找到自己的所有状态绘制概率密度，那么系统定期返回的那些具有最高概率的状态组合被称为回拉吸引子[66,82]。我们可以将生物大部分时间所处的状态（即该空间的区域）与其表型状态联系起来。

描述系统处于非平衡稳态（即其表型状态）的概率密度被恰当地称为非平衡稳态密度。这种系统动力学的概率描述可以用两种相互一致和互补的方式来解释。首先，系统可以用系统状态流来描述系统状态流会受到随机波动在这种情况下，我们可以用路径积分公式来表示流，作为最小作用路径。同样，我们可以用在任意随机时间采样时发现系统处于某种状态的概率来描述非平衡稳态。这两种描述在数学上联系在一起，因为在非平衡稳态下，流动是描述密度动力学的福克普朗克方程的解。这种双重解释将在后面发挥至关重要的作用。

2.2. Markov Blankets and the Dynamics of Living Systems

2.2.马尔可夫毯子和生命系统的动力学

自由能原理建立在动态系统理论方法的基础上，该方法涉及系统的时间演化，但现在增加了对这些系统的统计特性和可测量性的考虑。自由能原理允许我们以两种数学上等效的方式（统计的和动态的）之一来描述系统状态的流动这种等价性是通过存在一个条件所带来的条件独立性来保证的。

对于一个系统的存在（与宇宙的其余部分分开），它必须具有一定程度的与其嵌入环境的独立性。马尔可夫毯是一组变量或状态，我们用它们来根据系统的组成部分（内部状态，表示为 µ）和不属于系统的部分（外部状态，表示为 η）来规定性地对系统进行个体化。马尔可夫毯本身被定义为那些介导系统与其嵌入环境之间相互作用的状态（主动和感觉状态，表示为a和s）。马尔可夫毯的定义是缺乏某些连接：内部状态不会导致感觉状态，外部状态不会导致活动状态。参见图 1 和图 2。马尔可夫毯的存在导致内部变量和外部变量之间的条件独立。这里的关键词是“条件”：内部和外部并不是真正独立的如果我们通过一揽子状态来消除它们之间的依赖关系，那么它们看起来就是如此。

2.3. Information Geometries and the Physics of Sentient Systems

2.3. 信息几何和感知系统物理学

自由能原理背后的核心直觉是，如果一个系统被赋予了表型（即非平衡稳态密度）并且具有马尔可夫毯，那么有两种方法来描述系统的状态流：等效：植根于系统的状态空间描述，该描述是根据内部状态的流动或动态来制定的；另一个源于对同一流程的统计解释。在这样的系统中马尔可夫毯的存在确保了两种描述同时正确或彼此共轭[66,84]。

这种对系统内部相空间运动的描述是系统的“内在”信息几何，它与测度论和统计热力学密切相关。测度论是一个数学领域，研究如何系统地将数字分配给给定集合的子集，其中测度或度量精确地包含在这样的分配中；例如，概率度量系统地将概率值分配给子集的元素。我们可以将度量视为捕获有关抽象空间中的大小或距离的信息。通常，组成状态空间的任意点集没有度量，因此无法为该空间定义相关的距离概念。然而，人们可以为空间配备一个度量，通常以矩阵的形式来描述一个人移动了多“远”作为微小变化的函数就位。

在欧几里得几何中，这个度量只是一个单位矩阵，即，如果我沿着某个特定方向移动 100 m，那么我总共移动了 100 m。例如，对于球体上的运动来说，情况并非如此：例如，地球的周长约为 40,000 公里；如果我搬家（大约）在地球上同一方向 40,000 公里，我相对于地球表面根本不会移动（因为我将回到起点）。

在处理足够的统计数据和统计流形时，这种度量概念起着特殊的作用。足够的统计量是重建或参数化概率分布（包含无限数量的点）所需的最小数字集。对于正态分布或高斯分布，这些数字是均值和方差。统计流形是一个空间，其中坐标是概率密度族的充分统计量。例如，高斯分布的充分统计量是其均值和方差，给出二维统计流形或状态空间。给定该流形上的任何位置，都可以重建概率密度（将概率分配给无限多个点）。统计流形上的轨迹对应于相关概率密度的形状（即参数值）的变化。

反过来，信息几何是处理统计流形（信息流形，通常赋予费舍尔或黎曼信息度量）上的度量或度量的数学领域。换句话说，信息几何允许我们定义概率分布的度量（或连续变量的概率密度）；也就是说，我们可以讨论概率密度之间的距离。此外，如果我们将概率密度与概率信念联系起来，我们现在就有了一种自然的方式来谈论信念之间的距离。

有了这一切，我们就可以体会到自由能原理带来的好处了。从系统的状态空间描述开始，我们可以定义一个度量，使我们能够谈论系统内部状态的概率配置之间的距离。这种几何结构是“内在的” ，因为它以仅涉及内部状态本身（而不是环境的外部状态）的方式描述系统可能配置的结构。自由能原理表明，只要现有系统具有非平衡稳态密度并且马尔可夫毯发挥作用，那么就可以定义附加的（数学上共轭的）信息几何[66,84]。这两种信息几何可以采用以下（费舍尔信息）度量的形式，其中足够的统计量分别对应于预期的热力学状态和内部状态：

这允许一个惊人的观察：即，内部状态可以根据其外在几何形状来解释，即参数化外部状态的概率密度。这个简单的事实是定义马尔可夫毯子的条件独立性的自然结果。简而言之，对于每个毯子状态（即联合感觉和活动状态），都存在内部和外部状态的条件概率密度。至关重要的是，根据定义，考虑到所讨论的总体状态，这些都是有条件独立的。这意味着对于每个预期的内部状态，给定总状态，必须存在相对于外部状态的条件概率密度。反过来，这意味着预期的内部状态是一个统计流形，配备有外部信息几何。这种外在信息几何描述了关于外部状态的概率信念之间的距离，这些概率信念由预期的内部状态参数化。换句话说，预期的内部状态构成了关于外部状态的信念的充分统计数据。

2.4. Phenotypes: A Tale of Two Densities

2.4.表型：两种密度的故事

本质上，自由能原理是关于两种概率密度的故事[56]。第一个是非平衡稳态密度本身，它利用了表型的统计结构。第二种是变分密度，由系统的内部状态参数化或体现。我们已经看到，内部状态构成了关于外部状态的概率信念的充分统计。另一种看待这个问题的方式是说内部状态编码了一个概率分布变分密度产生感觉（和活动）状态的外部世界状态。从技术上讲，一个系统将朝着并维持其非平衡稳态发展，这意味着在给定总体状态的情况下，它可以最小化其所体现的变分密度与外部状态的概率密度之间的差异[66,84]。这种差异就是变分自由能，并且支持非平衡稳态的稳态流变成了变分自由能的梯度流。换句话说，内部状态看起来好像正在试图优化它们对外部状态的后验信念。当用外在几何学中的运动来表示时，人们可以根据贝叶斯信念更新来解释存在行为。这一切都是因为预期的内部状态参数化了关于外部状态的条件或贝叶斯信念。

从拟人化的角度来看，系统并不“知道”自己处于什么状态，但它看起来好像是根据先前的信念和当前的感官状态来推断“外面”的外部环境的状态。因此，外部世界的状态永远不会被直接感知，而是有机体通过与世界的相互作用主动推断和带来的东西。从这个意义上说，隐含的推论是积极的，在实用主义意义上是为了行动[56,57,85]。当有机体与世界相互作用时，它会扰乱外部状态和随之而来的感官状态。这些感官印象会耦合回与周围世界相协调的内部状态。换句话说，有机体根据所处的相互作用，对其生态环境的状态进行贝叶斯推理（即主动推理）。

为什么要推理？自由能原理表明，生物的存在是由于信息论量（称为意外量）上的梯度流而存在。这是福克普朗克方程的解，提供非平衡稳态。至关重要的是，非平衡稳态下的内部（和活性）态的动力学可以等效地视为沿着意外或自由能梯度流动。给定这些数据如何生成的（生成）模型，自由能对感觉（和活动）状态的非典型性进行评分[66,86,87]。

意外能量和自由能之间的等价性取决于以下事实：（预期的）内部状态参数化了关于外部状态的信念。当这种变分密度对应于外部状态的密度时，以覆盖状态为条件，惊奇能量和自由能是相同的。至关重要的是，自由能是变分密度的函数（即函数的函数）和隐式生成模型。生成模型只是外部状态和覆盖状态上的非平衡稳态密度。并且可以被视为外部状态如何生成总状态的描述。

接下来，我们将把生成模型视为任何拥有马尔可夫毯子的非平衡稳态的隐式属性。生成模型是隐式的，因为描述自组织和信念更新所需的唯一东西是自由能梯度。这意味着自由能及其生成模型没有被明确评估或实现。这有时被称为需要生成模型。 [56,88]。简而言之，自由能是两个密度的函数，即生成模型和由内部状态编码的变分密度。

对于熟悉信息论的人来说，惊奇也被称为自信息，自信息的长期平均值就是熵。这意味着非平衡稳态流会抵消随机波动造成的熵产生。反过来，这意味着自治状态（即内部状态和活跃状态）流动中隐含的推论支持了维持远离平衡的稳态的存在必要性。

那么自由能原理所说的是，只要马尔可夫毯在非平衡稳态密度下发挥作用，意外梯度流（状态函数）就相当于自由能梯度流（足够的函数）统计），其中足够的统计数据参数化外部状态的概率分布或关于外部状态的信念。这在动力学和统计学方面与上述关于共轭信息几何的推理相呼应。这里的梯度流仅意味着自主状态（即内部状态和活动状态；见图2）沿着变分自由能梯度流动。反过来，这只是谈论行动和感知的另一种方式。该方案将行动和感知自然化为梯度变分自由能上的主动态和内部态的流动（分别）被称为主动推理，即自由能原理的推论过程理论。

主要的信息是，自由能原理以两种互补的方式投射表型：作为非平衡稳态的状态流（通过内在信息几何描述）和需要信念更新的流（通过外在信息几何描述）信息几何）。凭借活跃状态，内部状态的明显作用不仅是推断感官数据的原因，而且还生成适当的交互模式。这意味着内部状态可以将关于行动后果的信念参数化，并促进信念行动的后果[66]。因此，生成模型不仅仅是为了进行确定世界真实状态的解释工作，它们还涵盖了对世俗状态采取行动的后果。

2.5. Living Models: A Mechanistic View on Goal-Directed, Probabilistic Inference and Decision-Making Under the Free-Energy Principle

2.5.生命模型：自由能原理下目标导向、概率推理和决策的机械观点

有了这个设置，我们就能够理解生成模型如何让生物体在自由能原理下进行目标导向的概率推理和决策。自由能原理通常被认为是生命系统只是其环境的生成模型[56,76,89–92]。现在我们可以理解这个看似神秘的主张了。自由能原理说，生物体利用其作用体的统计结构来保持其表型状态，其中该典型结构被概率地解释为所有系统状态的联合分布。接下来做什么的决策是基于“假设我是一个自由能最小化的生物，我必须做什么”的概率推断。

迄今为止，我们已经将推理视为自组织到非平衡稳态的突现属性。随后的贝叶斯力学得到了意外自由能和变分自由能之间的等价性的许可。接下来，我们可以更进一步，用定义自由能的生成模型来描述生物或粒子。一旦我们有了自由能，我们就知道了梯度。一旦我们有了梯度，我们就知道了梯度流。一旦我们有了梯度流，我们就可以自然地与环境进行任何具体的交换。

图 3 描绘了一个典型的生成模型。这里，隐藏状态(η)对应于马尔可夫毯子后面隐藏的内部状态的外部状态。关键的是值得欣赏的是，关于隐藏状态的信念对应于有机体所体现的关于其感觉原因的假设。这些隐藏状态可以说具有使它们成为结构表示内容的所有属性[8,31,32,34,35,56,93]。生成模型的隐藏状态由系统（例如大脑）的内部状态参数化，并编码有关指导自适应行为的外部状态的可利用信息。我们稍后会回到这一点。

总而言之，非平衡稳态下马尔可夫毯的存在使我们能够将生命粒子或生物与其内部状态和毯状态联系起来。内部状态的流动具有双重方面，通过共轭内在和外在信息几何来描述。这些几何形状自然地继承了分区的马尔可夫结构。内在信息几何描述了内部状态的热力学行为（例如，神经元动力学）。然而，内部状态也配备了外部几何，它涉及由内部状态参数化的外部状态的概率分布或信念。自由能（动作和感知）的主动状态和内部状态的梯度流，有效实现主动推理；即推断外部状态并计划下一步做什么。这就完成了我们对自由能原理的技术审查。

3. Deflationary and Fictionalist Accounts of Neural Representation

3.神经表征的通货紧缩和虚构主义解释

在回顾了自由能原理的技术核心之后，我们转向以下问题：来自认知科学的哪种解释框架最适合理解其代表性承诺（或缺乏代表性承诺）。由于现实主义帐户已在其他地方进行了广泛的审查，因此我们重点关注两个新颖的非现实主义帐户。

3.1. A Deflationary Approach to Neural Representation

3.1.神经表征的通货紧缩方法

在本节中，我们研究了一个有趣的立场，它涵盖了现实主义和非现实主义的各个方面；即，函数论、表征的紧缩解释[11,16]；对于关注大脑内容的相关但不同的解释，但它不涉及自由能原理下的信息几何，请参见 Wiese [94]。我们认为，这一立场的适当修改版本可以产生对自由能原理下的表示的最佳解释。

对表征的紧缩解释[11,16]开辟了一条介于现实主义和非现实主义之间的道路：神经表征作为信息处理机制的存在是现实的，可以使用计算方法来表征，但对于神经表征的认知内容则是反现实主义的。这些陈述。紧缩论认为科学家赋予的语义内容仅在认知能力的解释中起促进作用；并且内容的任何方面在解释上是有用的都可以用数学来指定。该解释建立在两个前提之上：（1）表征不是根据其内容来个体化或挑选的，而是根据其有助于实现的数学函数来个体化或挑选的；（2）该内容本质上不是由状态之间的自然关系和目标结构（即世界上的某个目标域）决定的，而是由数学内容决定的。

因此，对表征的紧缩解释认为（1）认知能力的计算理论必须提供该能力的功能理论表征，其中（2）为了科学实践，这可以伴随着“有意的注释”或语义解释：“内容是连接理论中假定的次个人数学能力和作为理论解释目标的明显个人水平能力的‘结缔组织’”（[11]，第253页）。

通货紧缩理论认为，认知表征理论所完成的解释工作在于对给定能力提供数学（功能理论）分析。而且这种计算理论往往伴随着认知或有意的解释，它起到启发作用，而不是强有力的解释作用[11,16]。因此，认知能力的内容可以通过诉诸系统实现的数学函数来自然地解释。这种数学内容对于物理过程的计算特征至关重要，“如果该机制计算不同的数学函数，并因此被分配不同的数学内容，那么它将是一个不同的计算机制” （[11]，第252页）。这允许对尚未与特定环境中的认知活动相关的系统进行计算描述。因此，确定内容相对容易，因为计算模型中部署的数学函数可以独立于所研究的系统的使用而被理解，即独立于所建模的过程。这很好地回应了自然主义表征理论最常见的缺陷，即预设了它们试图通过诉诸科学实践来解释的内容。神经表示的数学内容的表征在计算理论中得到利用，它由五个元素组成（[11]，见图3）：

1）由认知系统实现的数学函数；

2）系统用于计算函数的特定算法；

3）由该机制维护和更新的代表性结构；

4) 在表征结构上定义的计算过程。

5)生态成分：关于计算机制通常运行的典型运行条件的物理事实。

对此，常常添加启发式认知内容[11]。这种认知内容对应于基于观察者的神经车辆语义归属，通常基于神经组织的响应性与实验环境中对该组织呈现的刺激之间的可靠协变。在通货紧缩的解释下，这些认知内容是对计算理论提供的数学特征的“有意注释”，计算理论在解释所研究的能力或过程方面承担了所有繁重的工作。因此，科学家所采用的机制所代表的环境特性并不是设备或计算理论的本质特征。相反，它们只是为了便于解释相关能力而被归为，即，它们是对数学内容的有意修饰。

内容确定问题所固有的压力使非现实主义观点的支持者淡化了传统上归因于认知内容的作用[11,12]。根据这些观点，与认知科学、神经科学和哲学中的主流观点相反，认知内容不是认知的标志，并且不存在于内部状态或表征载体与目标域结构之间的自然主义关系中。它所建模的。具体来说，将计算机制与世界上的实际事物联系起来的认知成分并不是通货紧缩账户中认知活动的基本特征的一部分；它们有助于定义被解释物，但并不包含在解释本身中。相反，认知或语义内容仅仅是由实验者归因以促进相关能力的解释。简而言之，我们直观地认为表示的真实语义内容实际上只是一种注释，在构建科学解释时仅具有启发作用。

这存在着轻视认知内容及其旨在自然化的意向关系的风险。通货紧缩模型确实提供了一种解释心灵科学的方法，该方法对于指导神经科学研究实践具有明显的信息性和解释性作用。但这是有代价的。在内容的紧缩解释中，认知内容的作用变得如此弱化，以至于它不再是表征认知活动的必要条件；认知内容的唯一解释性用途是帮助科学家系统地理解正常操作条件，其中部署了各种机制的数学描述。最终，采取通货紧缩的选择似乎破坏了最初提出心理表征的假定动机，并且结果与激进的行动主义相吻合[9,15]。

3.2. Fictionalism and Models in Scientific Practice

3.2.科学实践中的虚构主义和模型

其他帐户也有非现实主义的，也许不太坚决的反现实主义的味道[17,76]。科学哲学中的虚构主义者或工具主义者的解释表明，科学模型是有用的虚构：它们并不是字面意义上的真实，而是“足够真实”，或者足以对世界做出有用的预测并采取行动。对神经表征的虚构主义解释表明，它们是科学家用来解释意图行为的有用函数：它们是科学家使用的模型。

在科学哲学中，基于模型的方法[95‑98]表明科学工作在于比较不同类型的模型。 “经验充分性”或启发式的“足够真实”的概念占据了认识论和科学哲学争论的中心舞台[96‑101]。这个概念允许模型假设的内容与我们在现实中发现的内容之间存在一定程度的差异；它意味着模型不必是事态的真实表示。科学进步往往依赖于理想化，成功的模型往往故意包含“恰当的谎言”，这些谎言虽然没有描绘出“真实的世界”，但确实具有价值和解释力。这种启发式使用模型的例子包括统计力学中的理想气体模型和遗传学中的哈代‑温伯格模型，这两个模型在各自的学科中占据着核心作用，但并不是字面意义上的真实描述。

因此，模型在理解某个主题方面发挥着重要作用，尽管它们不能准确反映世界的因果结构，但恰恰是因为它们“足够真实” 它们使研究人员能够专注于特征通过排除不相关的特征，与正在测试的假设相关[96,97]。值得注意的是，建模是一种非还原性的探究环境，即使用建模方法研究的目标系统不必还原为建模的内容[102]。

解释的目的是产生理解[99,103,104]。我们对模型在科学实践中的解释作用的认识并不依赖于对模型的现实主义解释[98]。模型很有用，有时与其解释现象的能力无关。如果一个模型提供的解释不能准确地代表其目标系统的原因，并不一定意味着这些解释不是真正的解释[99]。例如，在科学中，模型可以用来构建新模型[105]。模型存在非解释性用途，即不利用其表征能力本身的用途[106]。尽管模型不能准确地表示目标域的属性，但它可以发挥解释作用[107]。

一个微妙的问题是，自由能原理和主动推理中的生成模型是否应该以现实主义或工具主义的方式来解释。也就是说，实验使用自由能原理模型的生成模型来解释认知系统的行为，还是有机体实际上利用这些模型来保持活力并采取适应性行动？最近的一篇论文[76]强调了这种模糊性。接下来我们将讨论这个问题，因为我们批判性地修正了神经表征的紧缩主义概念。

4. A Variational Semantics: From Generative Models to Deflated Semantic Content

4. 变分语义：从生成模型到压缩语义内容

4.1. A Deflationary Account of Content Under the Free-Energy Principle

4.1.自由能源原理下的内容通货紧缩解释

在最后一节中，我们结合了神经表征的通货紧缩和工具主义的元素，提出了一种以有机体为中心的虚构主义或工具主义。我们扩展了压缩数学内容的生态成分，我们认为这导致了一种自然主义的意向性理论：一种基于自由能原理的语义内容的形式理论。制定可靠的语义内容数学理论的关键是能够自然化意向性，就是注意到自由能原理本质上讲述了一个关于系统与其环境之间相互协调的故事。

我们认为，表征内容的紧缩观点淡化了计算理论本身的第五个生态组成部分的作用。我们认为，使用自由能原则的资源来制定生态成分使我们能够挽救语义内容的意向性，从而恢复与有意相关（或关于）的领域相关的稳健的内容概念，而无需诉诸认知内容的人为有意的修饰。由此产生的观点是一种语义，它是从我们正在考虑的系统配备了状态和信念的双重信息几何这一事实中自然出现的。

支持自由能原理的形式主义允许一个重要的观察：即，起作用的数学结构和过程是在状态空间上定义的，并且隐含地在相关的信念空间或统计流形上定义的[93]。状态空间形式主义的数学框架意味着系统的动力学是通过系统的状态来定义的；并且由于相关的外在信息几何，我们总是可以将语义与这种内在描述相关联。

这种语义来自于外在信息几何中内置的“信念”。 “信念”一词在“信念传播”和“贝叶斯信念更新”的意义上使用，它们只是谈论概率分布或密度的方式。贝叶斯术语中的“信念”是后验和先验，对应于由物理实现的状态（即参数化外部状态分布的内部状态）形成的概率分布（可能状态的世界）。

一般来说，虽然我们使用术语“信念”来描述在外部状态上定义的概率密度，但人们普遍认为这些密度本身与命题信念不同。简而言之，命题信念具有真值条件；也就是说，它们是一种可以为真或为假的事物[15]。这里起作用的概率密度不是这种类型的。它们代表变量共变的方式。这并不意味着真值条件，这意味着它们是非命题的。

人们经常注意到，人们不能从单纯的系统协变中获得语义内容[6,15,108]。然而，这一论点可以通过注意到以下事实来驳倒：在自由能原理下，对于任何生命系统，都有一种隐含的语义在起作用，它融入了系统的动力学中。重要的是，这只是说系统的内部动力学具有将其连接到嵌入系统的概率方面（和外部信息几何）。通过马尔可夫划分，我们总是可以将内部（统计）流形上的状态轨迹与语义联系起来一种脱离系统动力学并且可以纯粹用数学来表征的形式语义。

因此，我们从系统与其上下文之间的相互作用以及有机体与其生态位之间的环境相互作用的历史中获得了真正的形式语义。从我们的解释中得出的是一种更“现实”的紧缩立场，一种弱紧缩立场，根据这种立场，表示的内容确实是它实现的数学函数，但这种计算理论本身需要隐含的语义。

4.2. From a Computational Theory Proper to a Formal Semantics

4.2.从正确的计算理论到形式语义学

现在让我们盘点一下。我们保留了通货紧缩账户中代表性内容的一般描述。我们现在使用这个紧缩模型来指定

计算理论，该理论通过自由能原理产生形式语义。

计算理论本身有五个组成部分，我们可以将它们映射到自由能公式的元素。（1）在自由能原理下，认知系统（的梯度流）实现的数学函数是自由能函数，用于测量后验密度和变分密度之间的差异。 (2) 系统用于计算该函数的具体算法是变分自由能梯度下降。 (3) 呼应结构表征的文献，由结构表征维护和更新的表征结构

计算理论本身有五个组成部分，我们可以将它们映射到自由能公式的元素。(1)在自由能原理下，实现的数学函数认知系统（的梯度流）是一个自由能函数，用于测量后验密度和变分密度之间的差异。(2)系统采用的具体算法计算这个函数是变分自由能的梯度下降。(3) 与结构表征的文献相呼应，机制所维护和更新的表征结构就是系统的内部状态。 (4) 在这些表示结构上定义的计算过程以及更新和维护它们的计算过程被实现为主动的推理。(5)最后，生态成分由对偶信息几何提供。

图 4 和图 5 根据自由能原理重新表述了 Egan [11] 的内容通货紧缩解释。我们修改了通货紧缩的解释，以强调它为我们提供了对语义内容起源的完全自然主义的数学解释，根据信念和意图的演算，这是内部状态流的内在描述的对应部分。请注意，生成模型中的外部状态隐含地定义了生态成分——而且这纯粹是数学上的。这通过纯粹诉诸众所周知的数学和物理过程和属性来克服自然化意向性的问题。

图 5. 自由能原理下的形式语义。贝叶斯认知科学不必致力于携带命题语义内容的经典表示概念。自由能原理使我们能够制定形式语义。自由能原理下的“表征”本质上，它们是在流物理学（例如动力系统理论）和信息几何下形式化的，并且它们可以更好地理解为使系统能够解析其感知流（即作为本体）的内部结构。在这里，我们将内容通货紧缩解释的主要组成部分[11]与自由能公式联系起来。支持自由能原理的数学函数是变分自由能泛函。具体算法是该自由能泛函的梯度下降（即流），它定义了系统“冲浪”直到达到非平衡稳态的梯度。表征结构（即体现或执行这些过程的结构）对应于系统的内部状态和相关的内在信息几何。计算过程本身就是主动推理，它提供了使用生成模型进行策略（行动）选择的总体框架。最后，生态成分是由双重（内在和外在）信息几何所带来的隐含语义定义的：通过相关的外在信息几何，系统看起来好像它的行为是关于外部状态的信念的函数。

4.3. Phenotypic Representations? Ontologies?

4.3. 表型表征？本体论？

我们的最后一步是利用虚构主义的叙述来细致地阐述刚刚排练的叙述证明了神经表征构造的正确性。这种细微差别有两个方面：关于术语“神经”和“表征”。

首先，术语“神经”应替换为“表型”，以反映自由能原理下压缩的数学内容载体的扩展实现基础。自由能原理证明了神经表征主义的精神是正确的。我们确实可以将数学内容分配给代理内部的结构，当正确的生态条件发挥作用时，这些结构就会编码或携带语义内容（感谢生命系统的双重信息几何）。然而，扮演这一角色的内部状态与象征或联结主义传统中的经典表征相去甚远。它们本质上包含系统的所有内部状态，因此并不是严格的神经状态。其结果是，神经表征主义直觉被其传统对手，即具身生成的认知方法所证实：如果在自由能原理下存在类似结构表征的东西，它们就对应于系统的身体状态，并被利用、维护。，并通过适应性行动的历史进行更新。

其次，关于“表征”一词，我们注意到，在自由能原理下，压缩的表征结构最好被理解为系统在理解其环境时所带来的本体论；也就是说，它用来解析其感觉状态流的一组假设或类别。

启发式地，我们说自由能原理允许这样的主张：系统相信这个或那个环境因素造成了它的感官印象。根据上面的讨论，似乎更准确的说法是，当处于通常的生态有效运行条件时，配备有这种处于非平衡稳态的分区的系统将以一种看起来好像有与其环境的某些特征的有意关系。我们现在知道这个“仿佛”特征意味着什么：它指的是信息几何的二元性，从而指的是可能描述的二元性（就流向非平衡稳态的流动而言，就生成模型下的信念更新而言）。

自由能原理源自称为生成建模的建模策略。在这个方案中，我们写下了产生数据的过程的替代概率模型，并根据每个模型解释数据方差的程度对每个模型的概率进行评分。这个分数就是变分自由能。至关重要的是，正如上一节所讨论的，这些模型是关于产生我们的数据的过程结构的假设。这些模型中的隐藏或潜在（参见外部）状态本质上是对感官数据原因的猜测。至关重要的是，它们不需要反映现实中任何事物的存在[66,84,109]。这是一个微妙但重要的观点。外部状态仅相对于生成模型和伴随的表型而存在，并且只有在它们涉及适应性的、适合情境的行为的生成时才发挥作用。

我们有效地将通货紧缩的解释与虚构主义或工具主义的解释结合起来，以提供一种可以称为以有机体为中心的功能主义的解释。有机体的表型（其运动和作用体）是一种非平衡稳态密度，可以解释为系统状态流随时间平均趋于稳定的流形；也作为系统所有变量的联合概率分布。有机体的行为是由这些密度动力学驱动的：通过趋向于其非平衡稳态密度的趋势，这是通过变分自由能的梯度下降（又名主动推理）来实现的。

这只是生物体选择的行为是由其表型的统计结构以及与环境的相互作用驱动的另一种说法。有机体利用其自身的统计结构来驱动其行为选择。这与具体化的认知方法相吻合，并有效地构成了形态学、发展和进化计算[115,116]和知识驱动的熟练行动[77]的新观点。

虽然我们的目的是探索非实在论认知方法的后果，但我们注意到，我们提出的实用主义解释可能与某些实在论、结构表征主义的解释相一致，其中内容是由功能同构决定的，从而阐明了使用功能角色语义形式的结构表示[8,32,81]。这些描述明确地朝着不需要所表示的系统在现实中实际存在的方向发展，这与刚刚提出的本体论的描述是一致的。自由能原理保证了存在携带语义内容的表型状态的主张；在这里，我们阐述了适合这种数学语义的计算理论。归根结底，我们对这些状态的称呼可能只是一个偏好问题。

5. Conclusions 结论

在本文中，我们的目的是评估神经表征的构造是否在变分自由能原理下发挥解释作用，并确定关于表征构造的本体论和认识论状态的哪种哲学立场最适合该理论。我们研究了非现实主义方法，而不是更常见讨论的现实主义方法。我们首先对心理表征进行了紧缩解释，根据这种解释，神经表征的解释性相关内容是数学性的；根据虚构主义解释，表征是科学上有用的虚构。我们希望表明，在自由能原则下，即使是对神经表征所承载的内容类型的极简主义、通货紧缩的解释，也需要诉诸语义内容，这与现实主义立场相呼应（但又不同）。我们希望表明，通过利用修改后的虚构主义解释，源自自由能原理的形式语义可以为我们提供对生命系统的有关性或意向性的解释。

在哲学上，很大程度上取决于代表某个目标领域的含义，特别是在精神状态和实现它们的物理状态之间的关系方面。自由能原理与心灵哲学中的经典立场（例如物理主义一元论、对偶一元论和笛卡尔二元论）之间的关系已在其他地方进行了详细探讨[84]。

我们只会评论其中哪一个似乎与我们的帐户最一致。简而言之，在关于精神和身体状态之间关系的哲学观点中，我们的观点与功能主义及其所带来的多重实现的概念最为一致。功能主义认为，表征心理状态的特征并不是该状态的内在特征。状态，而是该状态与系统其他状态之间的功能（例如，输入输出）关系[ 117,118]。多重实现认为，相同的（心理）宏观状态可以通过（物理）微观状态的不同配置以不同的方式实现，只要它们实现适当的功能（例如，计算）关系[118]。我们的观点与功能主义之间的接近是基于语义内容如何在

自由能原理，通过将虚构的外部状态分配给自由能原理的双信息几何所隐含的内部状态。如上所述，自由能原理允许这样的主张：对于每个总状态，我们可以识别内部状态的平均值，我们可以将其与（虚构的）外部状态的概率密度参数相关联。需要注意的关键一点是，可以如此关联的是内部状态的平均值。这意味着外部状态的概率密度可以通过内部状态的等价类来实现，其末端参数化相同的信念。对于我们最初的问题，这给我们带来了什么启发？我们讨论的结果是，在自由能原理下，有机体内部确实存在作为语义内容承载者的结构。这些结构可以根据通货紧缩账户所持有的计算理论本身进行数学指定。然而，凭借在自由能原理下发挥作用的双信息几何，这种纯粹的数学解释带有隐含的语义：系统解析和理解潜在因果因素（或本体论）的一组假设。它的感官流。这可能被视为证明了引言中讨论的结构表征主义解释的正确性，尽管有一个关键的转折：那些承载内容的结构不仅仅是神经表征，而且实际上是表型表征（如果它们真的是表征的话），因为它是所有的表征。考虑到马尔可夫划分，生物体的内部状态具有该内容。

一个悬而未决的问题是所提供的框架是否能够解决虚假陈述的问题。任何候选人的代表性结构至少在原则上必须能够歪曲其所代表的事态。长期以来，这一直是代表性讨论中的一个症结所在[119]。简而言之，由于误传是可能的（例如，将一个对象识别为另一个对象，但事实并非如此），因此对表征的解释需要考虑到误传，同时还指定是什么使关于一个对象的表征与另一个对象相对应如果它可以由两个对象[3,120]。我们正确地指出，在自由能原理下使用的信息论度量只是协方差的度量，不足以解释误述[108]。我们认为这张图是不完整的。更全面地解决这个问题的未来方向首先是注意到变分自由能对感官数据与引起该问题的原因的假设相符的程度进行评分。变分自由能不仅仅是一种信息测量，而是测量当前感知数据与在某种本体论或假设下预期的感知数据之间的差异，这赋予它不可简化的语义方面。高自由能表明该假设无法“解释”数据，或者其他一些假设会表现得更好。因此，所提供的语义模型可能能够解释误述和寻找替代假设。

我们在本文中主要关注的是表明表型状态可以通过主动推理来获取紧缩（数学）排序的语义内容。值得注意的是，这种语义内容并不等同于在语言使用中发挥作用的那种命题内容，我们的解释也没有解释人类主体使用语言和叙事来时尚和重塑自己作为主体的方式[121,122]。虽然这个问题至少可以说超出了本文的范围，但我们总体上同意这样的观点：从语义内容到命题内容的转变要求代理参与特定类型的涉及内容的实践。这些实践例如说真话[9,15]和讲故事[123]，它们极大地建立在代理的基本表征或语义能力之上，通过实现更复杂、故事化的自我访问形式，如果没有这种能力，这是不可能的。语言。

对于我们最初的问题，这给我们带来了什么启发？我们讨论的结果是，在自由能原理下，有机体内部确实存在作为语义内容承载者的结构。这些结构可以根据通货紧缩账户所持有的计算理论本身进行数学指定。然而，凭借在自由能原理下发挥作用的双信息几何，这种纯粹的数学解释带有隐含的语义：系统解析和理解潜在因果因素（或本体论）的一组假设。它的感官流。这可能被视为证明了引言中讨论的结构表征主义解释的正确性，尽管有一个关键的转折：那些承载内容的结构不仅仅是神经表征，而且实际上是表型表征（如果它们真的是表征的话），因为它是所有的表征。考虑到马尔可夫划分，生物体的内部状态具有该内容。

Appendix A 附录A

A.1. The Langevin Formalism and Density Dynami

A.1. 朗之万形式主义和密度动态

人们可以用随时间变化的状态流来表达随机动力系统，这些状态流会受到随机波动的影响（请参阅术语表了解变量的定义）：

这是（朗之万）动力学的一般规范，几乎涵盖了所有物理学[124‑126]；从某种意义上说，大多数现代物理学都以朗之万形式主义和随后对随机涨落下系统状态流动的描述为前提。这可以等效地用密度动力学（通过福克·普朗克方程或薛定谔方程）或路径积分公式来描述。从这些描述中，几乎所有的量子力学、统计力学和经典力学都可以推导出来。

我们对具有可测量特征的系统感兴趣，这意味着它们拥有吸引集或流形，称为随机吸引子或回拉吸引子[82]。这意味着，如果我们在随机时间观察系统，就有一定的概率发现它处于特定状态。这是非平衡稳态密度[126]。

现在可以使用密度动力学的标准描述将状态流表示为自信息或意外的梯度流[127‑130]。该流动是(A1) [131–135]中福克普朗克方程的稳态解。

这个方程表明，平均而言，任何具有吸引集的随机动力系统的状态都会令人惊讶地表现出梯度流；即非平衡稳态密度的负对数[136,137]。梯度流有效地抵消了随机波动造成的色散，使得概率密度不随时间变化。参见图4。

图A1。密度动力学和回调吸引子。该图描绘了可以通过朗之万方程描述的随机动力系统的密度或系综动力学。左图描绘了两种状态的时间演化，作为一个奇怪的吸引子。该空间中的点为系统分配沿每个维度的位置，从而为每个状态分配一个值。在这里，每个维度代表两种状态之一，轨迹绘制了状态随时间的演变。右图代表任意随机吸引子（回拉吸引子）。人们可以用两种方式来思考这个回调吸引子。首先，吸引子可以表示系统状态随时间变化的轨迹（在这种情况下，表示两个状态）。该轨迹的关键特征是，在经过足够的时间后，它将重新访问状态空间的特定区域，这些区域构成了回调吸引子本身。第二种解释是概率性的：它将吸引集转换为随机采样时可以找到系统的状态上的概率密度。福克-普朗克方程使我们能够描述这种概率密度的演变。反过来，这也获得了福克-普朗克方程的解。这样做的结果是我们可以在系统状态空间中任意点的概率密度和状态流之间建立合法的关系。该解决方案根据对数密度或意外的梯度以及随机波动的幅度来描述系统状态的流动。反过来，亥姆霍兹分解允许我们用两个正交分量来表达非平衡稳态解。其中之一是无旋度梯度流，它取决于随机波动 T 的幅度。该组件重建概率梯度，有效抵消随机波动对状态的影响（即抵消其离散度）。另一个组件是无散（或螺线管）流，它在等概率轮廓上循环，并且取决于反对称（斜）矩阵 Q。该图描绘了具有高斯或正态形式的概率密度峰值周围的流。有关技术细节，请参阅[66,137,138]。

上面的方程对于内部状态、毯子状态和外部状态都成立（非常重要）。如果我们只关注内部和活跃（即自主）状态，我们有以下流程。请注意，如 (A2)中所示，Qaa 和 Γαα 分别表示反对称矩阵和前导对角矩阵。

这意味着任何具有马尔可夫毯的系统都必须表现出上述梯度流。反过来，这意味着内部状态和活动状态看起来好像它们试图最小化相同的数量；即构成事物、粒子或生物的令人惊讶的状态。这些是内部状态和总状态，即特定状态。

A.2. Bayesian Mechanics

如果内部状态和外部状态有条件独立，那么对于每个给定的总状态，都存在预期的内部状态和外部状态的条件密度。换句话说，对于每个给定的总状态，粒子（或生物）的平均内部状态与外部状态的概率密度之间必须存在一对一的关系。这意味着我们可以表达外部状态的后验或条件密度作为由内部状态参数化的变分密度：

这使我们能够将自主状态流 α = {a, µ}（即动作和感知）解释为变分自由能的梯度流。

该泛函可以用多种形式表示；即，期望能量减去变分密度的熵，这相当于与毯状状态（即意外）相关的自信息加上变分密度和后验密度（即界限）之间的 KL 散度，在此例如，由 (A4) 为零。反过来，这可以分解为覆盖状态的预期对数可能性（即准确性）以及后验密度和先验密度之间的 KL 散度（即复杂性）。

(A4) 带来的第二件事是信息几何和信念演算。从现在开始，我们将把信念与由（预期）内部状态参数化的概率密度联系起来。请注意，这些信念是非命题性的，其中“信念”在“信念传播”和“贝叶斯信念更新”的意义上使用，它们始终可以表述为最小化变分自由能[139–141]。为了根据信念来描述这种条件密度，我们现在可以诉诸信息几何[135,142–144]。

请注意，变分自由能及其梯度是生成模型(η, b) = －ln p(η, b) 的函数，其形式为外部状态和毯状状态的意外形式。这意味着状态上的非平衡稳态密度可以被解读为支持自主梯度流的生成模型。

A.3. Information Geometry and Beliefs

A.3.信息几何和信念

任何统计流形都必须配备一个独特的度量张量，称为费舍尔信息度量[135,142,145]。

这里，d` 是与统计流形上的小位移相关联的信息长度，

dµ = µ 0 − µ是由概率密度qµ(η) 引起的。信息长度评分指的是在从统计流形的一部分移动到另一部分时遇到的不同概率或信念状态的数量。

如果我们回到由马尔可夫毯引起的独立性，方程（A4）告诉我们一些基本的事情。期望的内部状态已经获得了信息几何，因为它们参数化了关于外部状态的概率信念。简而言之，在某些信念空间中存在一种唯一的几何结构，可以与任何粒子或生物体的内部（物理）状态相关联。此外，我们知道描述内部状态动态的梯度流可以表达为信念的变分自由能泛函（即关于函数的函数）的梯度流：参见（A5）。

回想一下上面所述，信息几何是任何统计流形的属性。内部状态概率密度的参数是热力学变量λ（例如压力），支撑热力学或统计力学。我们将相关的信息几何称为内在几何，因为它涉及到内部状态本身。从我们的角度来看，这意味着有两种信息几何在起作用，具有以下度量：

首先，存在一个基于热力学变量的内在信息几何。这构成了物理学中统计力学的基础。同时，存在一个信息几何，位于内部状态空间，涉及对外部状态的信念分布。这是指涉自马尔可夫条件继承的外在信息几何，这些条件通过它们的马尔可夫毯，定义了自主状态。外在几何与内在几何是共轭的，它们以在相同的 Langevin 动力学上监督的意义上存在。

词汇表

（注：a.u.代表任意单位，例如米（m）、弧度（rad）等）