在AI模型迭代的赛道上,我们总习惯追逐“更大参数、更多数据”的竞赛,就像在有限空间里堆砌物品的粗放式收纳——只想着扩大空间(增大模型),却没琢磨过空间本身的利用逻辑。而优秀的收纳设计,核心从不是空间大小,而是通过科学堆叠机制,让有限空间容纳更多物品,且互不干扰、取用高效。
在LLM的隐藏空间里,也藏着这样一套“高效收纳逻辑”——表征叠加(representation superposition)。它能让模型在有限的维度里,表征远超维度数量的tokens和抽象概念,就像把更多物品通过精准堆叠放进固定收纳柜。以往研究要么忽视这套机制,要么只触及“弱叠加”的皮毛,而这篇论文首次证实:LLM真正运行在“强叠加” regime,正是这种机制让缩放律摆脱了数据分布的束缚,实现了稳健的1/m(模型维度)损失衰减。
大型语言模型的成功依赖于“模型越大性能越好”的神经缩放律,即损失随模型规模呈幂律下降,但这一现象的起源始终不明确。现有解释多聚焦于函数逼近、流形拟合或技能学习,且隐含假设模型处于弱叠加态,与LLMs实际运行机制存在差距。LLMs需在有限维度的隐藏空间中表征数万词汇及抽象概念,必然依赖叠加机制(表征数量超过空间维度),而叠加程度如何影响损失缩放、何时呈现幂律关系及幂指数大小等关键问题尚未得到系统研究。解决这些问题对理解缩放律的适用边界、优化模型设计具有重要意义。
表征叠加的强度决定了神经缩放律的稳健性:弱叠加态下损失缩放依赖数据特征分布,强叠加态下损失随模型维度呈普适的1/m幂律,且LLMs恰好运行于强叠加态。这一观点突破了传统研究对叠加机制的忽视,首次将叠加程度作为调控缩放行为的核心变量,通过可控实验验证了其对不同数据分布的适配性。不同于以往依赖数据幂律分布的解释,该研究揭示了几何重叠主导的缩放机制,为LLMs缩放律的普适性提供了新的理论支撑,同时为模型优化指明了“增强叠加”的新方向。
• 【直观比喻】:将模型的隐藏空间比作一个容量固定的“储物间”,数据特征则是需要存放的“物品”。弱叠加态如同只摆放体积最大、使用频率最高的少数物品,其余物品被丢弃;强叠加态则是通过合理的堆叠摆放(允许物品部分重叠),在不增加储物间容量的前提下存放更多物品,且重叠部分通过巧妙设计(如分隔板)减少相互干扰。 • 【比喻映射】:储物间容量对应模型维度m,物品对应数据特征,物品使用频率对应特征频率p_i,堆叠摆放对应表征向量的几何重叠,分隔板对应ReLU激活函数与负偏置的误差校正机制。弱叠加态中,仅高频特征被完美表征(无重叠),低频特征被忽略;强叠加态中,所有特征均被表征(存在重叠),但通过几何优化使重叠干扰最小化,从而实现更多特征的有效存储。
论文基于Anthropic的自编码器玩具模型,通过权重衰减(weight decay)调控叠加程度,核心数学模型包括特征激活机制、损失定义与叠加调控公式。特征激活遵循(服从伯努利分布控制激活与否,服从均匀分布控制激活强度),损失定义为重建误差₂²ₓ(为模型输出),叠加程度通过权重更新公式调控:其中为权重衰减系数(时鼓励行向量单位范数,增强叠加;时抑制叠加),为学习率,为t步时权重矩阵第i行向量。通过该模型,论文系统分析了弱/强叠加态下损失与模型维度、数据特征分布的关系。
论文围绕“叠加态调控→理论推导→机制验证”的核心逻辑,从模型构建、数学建模到理论落地形成完整闭环。以下将基于论文内容,详细阐述每个步骤的细节。
核心前提假设:
整体框架:通过四步闭环验证叠加态与神经缩放律的关系:

图1
任务定义: 模型目标是将高维特征向量 (代表输入数据,如文本中的token)压缩为低维隐藏表征 (其中 ),然后重建回原始特征,最小化重建损失 。这模拟了LLM的“token嵌入→隐藏表征→输出预测”过程。具体架构如图2a所示:输入 通过权重矩阵 映射到隐藏层 ,然后通过ReLU激活函数输出重建 ,损失函数为 ( 表示对数据分布取平均)。
核心变量明确定义:
传统模型无法量化调控叠加态,论文设计了分段式权重衰减更新规则(公式2),实现从弱到强叠加态的连续切换:
理论推导的前提是论文中定义的玩具模型(Toy Model),该模型模拟了LLM的表征学习过程。关键假设和设定如下:

图2
弱叠加态下,模型仅表征高频特征,损失由未表征特征贡献。推导基于以下逻辑:

图3
强叠加态下,所有特征均被表征,损失源于表征向量的几何重叠。推导涉及向量几何和优化理论:

图4

图5
通过严格的理论推导和实验验证,论文证明了叠加态是神经缩放律的核心机制:
映射逻辑:
交叉熵损失等价性(论文附录A.2):
实证验证:
理论推导明确:叠加态强度是神经缩放律普适性的核心决定因素。
实验分为“玩具模型验证”和“LLM实证验证”两部分,均严格遵循“变量控制→参数固定→数据采集→结果拟合→机制验证”的流程,所有超参数、数据分布、评估指标均来自论文正文及论文附录B、C的详细说明。
子实验1:LLM叠加态判定(验证是否为强叠加态)
子实验2:平方重叠度缩放验证
子实验3:损失缩放指数验证