首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >写给做“风格择时”的你们:从市场状态到配置状态

写给做“风格择时”的你们:从市场状态到配置状态

作者头像
量化投资与机器学习微信公众号
发布2026-04-02 16:07:02
发布2026-04-02 16:07:02
630
举报
图片
图片

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业50W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。

图片
图片

公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章,愿与你共同进步! 本期遴选论文 来源:The Journal of Portfolio Management Multi-Asset Special Issue 2026 标题:Allocation-Focused Regimes and Applications to Dynamic Factor Investing 作者:Chenyu Yu, John M. Mulvey, Yuqi Nie

问题的起点:传统Regime为何难以直接用于投资

在量化投资和资产配置研究中,“Regime(市场状态)”一直是一个非常核心的概念。无论是宏观资产配置、风险平价、CTA,还是股票多因子投资,研究者都习惯用不同的状态来描述市场在某一阶段所呈现出的相对稳定特征。比如,人们会将市场划分为牛市与熊市、高波动与低波动、通胀上行与通胀下行、信用扩张与信用收缩等。围绕这些状态,学术界和实务界已经发展出大量模型,并试图借此解释资产收益的变化。

但如果从投资决策的角度看,这类 Regime 框架始终存在一个并不容易回避的问题:它们往往更擅长解释市场,却不擅长直接指导配置。一个宏观 Regime 可以告诉投资者,当前的市场环境偏向防御,或者波动率正在抬升,但它通常并不能直接回答一个更接近投资本质的问题:在这样的环境下,究竟应该增加哪一种资产、哪一个因子、哪一类策略的权重?

这意味着,传统 Regime 与资产配置之间,始终隔着一道隐形的“翻译层”。先识别市场状态,再由投资者或模型将这一状态翻译为配置行为。问题在于,这一步翻译本身往往高度依赖经验判断,容易受到样本期、主观理解和市场环境变化的影响。也正因为如此,许多看起来“很合理”的 Regime 模型,最终并不能自然地闭环到投资决策中去。

从更深的层面看,问题并不一定在于这些 Regime 是否准确,而在于它们从一开始就不是为“做选择”而设计的。它们首先回答的是“市场正在发生什么”,而不是“现在应该配什么”。这篇文章最重要的出发点,正是意识到了这一点,并试图把 Regime 从解释工具,重新塑造成决策工具。

概念的转向:什么是配置导向的Regime

围绕上述问题,作者提出了一个非常关键的概念:Allocation-Focused Regime(配置导向状态)。它与传统 Regime 的最大区别在于,不再从宏观变量、市场整体特征或某类资产的绝对涨跌来定义状态,而是直接从策略之间的相对表现出发来定义状态。

例如,如果在某一段时期里,动量因子持续跑赢某个基准组合,那么这一阶段就可以被定义为“动量占优的配置状态”;如果价值持续跑赢成长,那么这一阶段就可以被视为“价值占优的配置状态”。这种定义方式的本质,是把 Regime 从一个“关于市场的描述”,转化成一个“关于相对配置优劣的判断”。

这一转变的重要性非常大。它意味着 Regime 不再是一个外生的背景变量,而是一个内生于投资问题本身的结构信号。它不再要求投资者先理解世界,再将这种理解映射到资产配置上;相反,它从一开始就围绕投资者真正关心的问题展开——在若干备选策略之间,当前究竟哪一个更值得配。

从实务角度看,这种定义天然有三个优势。

  • 第一,它更直接。因为 Regime 本身就对应“谁更优”,所以它几乎可以被直接翻译为交易和配置行为。
  • 第二,它更聚焦。投资者真正关心的往往不是市场的抽象状态,而是某一组候选策略之间的相对排序。
  • 第三,它可能更容易预测。市场的绝对收益受到经济、行为、政策、地缘政治等诸多因素共同驱动,噪声很大;而策略之间的相对收益关系,在很多时候反而更稳定、更具可学习性。

如果用一句话概括本文的思想转向,那就是:

与其预测市场,不如直接预测“哪种配置更优”。

这不是语言层面的变化,而是问题定义层面的变化。一旦问题被重新定义,后面的建模路径也随之改变。传统 Regime 更像是在做“市场分类”;而 allocation-focused regime 则更像是在做“配置排序”。

为什么因子投资是最合适的实验场景

为了展示这一框架的有效性,作者选择将其应用在因子投资上。这是一个非常自然、也非常有说服力的实验场景。

一方面,因子投资是资产定价和组合管理中最成熟、最标准化的领域之一。无论是动量、价值、成长,还是大盘、小盘,这些因子都拥有长期的学术支持和实务应用基础。另一方面,因子投资又有一个非常重要的现实特征:长期有效,但中短期强轮动。也就是说,单个因子可能在长期内具备风险溢价,但在具体年份、具体市场阶段中,它们之间的相对表现经常发生切换。

这恰恰为 allocation-focused regime 提供了理想土壤。因为它要解决的问题并不是“某个因子是否长期有效”,而是“在当前阶段,哪个因子更值得配置”。如果因子之间不存在轮动,那么这个问题本身就不会成立;但现实恰恰相反,因子轮动几乎是因子投资最稳定的经验现象之一。

本文选取的研究对象包括六类美国股票市场中的经典 long-only 因子组合:Momentum、Reversal、Large、Small、Value 和 Growth。它们都来自 Kenneth French 数据库,样本覆盖时间足够长,能够穿越多个完整市场周期,也涵盖了技术泡沫、金融危机、疫情冲击等不同环境。对于一篇讨论 Regime 与轮动的论文来说,这样的样本设置是非常合适的。

从具体定义看,Momentum 对应过去一段时期中表现最好的股票组合,Reversal 对应过去表现最差的股票组合;Large 与 Small 分别代表大市值和小市值股票;Value 与 Growth 则分别对应高账面市值比和高价格收益比特征的股票。虽然这些定义本身并不新鲜,但它们之间天然构成了多组值得比较和切换的对象,例如动量与反转、价值与成长、大盘与小盘。

更重要的是,作者并没有停留在“因子列表”的层面,而是进一步展示了这些因子的长期收益曲线。

这张图在整篇文章中的位置非常关键,因为它并不只是一个背景图,而是构成了本文问题意识的经验基础。图中可以清楚看到,六类因子虽然长期都具有一定收益积累,但它们的表现绝不是平滑线性的。相反,不同因子之间存在明显的阶段性领先与落后。某些时期动量非常强势,某些时期价值重新占优;有时成长风格成为市场主线,有时防御性更强的风格表现更稳。这种“轮流占优”的结构,正说明了静态持有单一因子并不是最优方案,也说明了因子投资的真正挑战不在于“因子是否存在”,而在于“因子何时该配、何时该减”。

从这个意义上说,因子投资并不是对本文框架的一个偶然应用,而是最能体现其逻辑力量的场景之一。因为这里的问题天然就是相对问题:不是判断市场涨还是跌,而是判断一组风格、一组因子、一组策略之间,谁在当前更值得持有。

这篇文章真正要解决什么问题!

当研究对象和核心概念都明确之后,本文真正要解决的问题也就更加清晰了。它不是要提出一个新的宏观市场分类体系,也不是要证明某个因子比另一个因子长期更优,而是要解决一个更贴近投资实务的问题:

能否构建一种框架,先识别出“谁在当前阶段更占优”的状态,再预测这种状态何时出现,并将其转化为动态配置策略?

这个问题其实包含三个层次。

  • 第一层是定义问题:什么样的状态,才是真正与配置有关的状态?
  • 第二层是预测问题:这种状态是否具有足够的稳定性和可学习性,从而可以在样本外预测?
  • 第三层是投资问题:即使状态可以预测,它是否真的能带来更好的配置结果,而不仅仅是样本内的统计划分?

这三个层次层层递进,也决定了本文必须采用一个既能识别状态、又能预测状态、还能直接用策略表现来检验状态质量的框架。换句话说,这篇文章最关心的并不是“Regime看起来像不像”,而是“Regime是否有用”。

这也是它与很多传统 Regime 研究之间最根本的区别。很多市场状态研究,到最后停留在一个解释性结论:某类资产在某种宏观环境下表现更好。但本文并不满足于这种“事后合理”。它更进一步要求:如果这种状态真的有意义,那么我们应该可以在样本外提前识别和利用它,并最终在组合层面看到业绩改善。

因此,文章真正的研究问题可以概括为一句话:

如何把“谁更好”这件事,变成一个可识别、可预测、可交易的 Regime 框架?

方法总览:从识别到预测,再到配置

围绕这一问题,作者提出了一个非常清晰的混合式框架,可以概括为三个步骤:识别(identification)—预测(forecasting)—配置(allocation)。虽然本文后面会对每一部分展开细节,但从整体结构上先理解这一框架,对于把握全文逻辑非常重要。

第一步是用统计 Jump Model 在样本内识别 Regime。也就是说,先根据历史数据,把那些“某种策略明显优于另一种策略”的阶段划分出来,相当于给历史样本打标签。这里的重点不是预测,而是定义:先明确什么样的时期属于“动量占优”,什么样的时期属于“价值占优”。

第二步是用 XGBoost 来预测这些 Regime 是否会在未来出现。这里就进入机器学习的监督阶段:前一步生成的标签,成为这一阶段的学习目标;更丰富的市场信息和统计特征,则成为预测输入。

第三步是用策略表现来反向选择模型参数,尤其是控制 Regime 平滑程度的关键参数 λ。这个设计非常重要,因为它意味着作者不是单纯从统计拟合角度去选参数,而是直接从投资结果角度去选参数。换句话说,判断一个 Regime 框架是否“好”,最终不是看它分类是否漂亮,而是看它是否能做出更好的组合。

这三步合起来,形成了一个闭环:

  • 无监督学习负责“定义状态”;
  • 监督学习负责“学习状态”;
  • 组合回测负责“验证状态是否有投资价值”。

在这个框架中,一个非常值得注意的设计哲学是:识别与预测的功能被明确分离。 识别阶段强调简洁与局部准确,预测阶段强调丰富信息与泛化能力。作者认为,过去很多相关研究的问题恰恰在于没有把这两件事分开,导致状态本身定义得不够纯粹,或者预测模型受到标签噪声的干扰。本文通过这种解耦,试图让每一步都服务于自己最核心的任务。

状态识别:为什么选择Jump Model而不是直接做分类

如果说第一部分解决的是“应该定义什么样的 Regime”,那么从这里开始,文章进入更关键的层面:如何把这种配置导向的 Regime 识别出来,并进一步变成可预测、可交易的信号。作者的方法框架之所以值得重视,并不只是因为它把 Jump Model 和 XGBoost 放在一起使用,而是因为它对这两个步骤的功能做了非常清楚的切分:前者负责“定义状态”,后者负责“学习状态”。这种切分本身,正是整篇文章方法论的骨架。

作者在第一步采用的是 Statistical Jump Model(JM)。这不是一个随意的选择。对本文而言,最重要的问题并不是“如何最快地给样本贴标签”,而是“如何贴出一种具有时间稳定性、并且最终对配置有用的标签”。如果标签本身只是对日常涨跌噪声的简单反应,那么无论后面的预测模型多强,都不会得到真正可靠的结果。也正因为如此,作者没有直接把“哪一方当天表现更好”当作 Regime 标签,而是引入了一个显式考虑时间连续性的模型,让 Regime 成为一个具有持续性的状态,而不是日度收益正负的机械映射。

对于任意一组需要比较的策略,作者先构造一个相对收益序列。例如,如果研究的是某个因子相对基准是否占优,那么就构造“该因子收益减去基准收益”的序列;如果研究的是一对互补因子,例如动量与反转,那么就构造“动量收益减去反转收益”的序列。这样做的意义在于,原问题被压缩成了一个非常直接的判断:这段时期里,哪一边在持续占优?

Jump Model 的目标函数在文中写为:

这个式子表面上看是一个标准的带惩罚项聚类问题,但在本文中,它的金融含义非常明确。前一项要求每个时点的观测 (x_t) 尽量靠近其所属 Regime 的中心 ( ),也就是让同一状态内部具有统计上的一致性;后一项则对 Regime 的切换进行惩罚,只要相邻两个时点的状态不同,就要额外支付一笔代价。这一代价由超参数 ( ) 控制。于是,模型天然在做一件非常符合投资直觉的事情:它不会因为一天、两天的短期扰动就轻易宣布“市场状态变了”,而是要求某种相对优势具有一定持续性,才值得被视为一个真正可定义的配置状态。

从算法角度说,这个惩罚项把普通聚类问题变成了一个“既要分得准,又要分得稳”的问题;从投资角度说,它把 Regime 从短期收益噪声中拎了出来,使其更接近一个投资者真正可以依赖的状态变量。作者特别指出,当 () 时,Jump Model 退化为没有时间约束的聚类,这实际上非常接近于“只看当下、不看延续”的极端情况。这样的状态虽然可以解释样本内的局部收益波动,却并不一定具有预测价值。

这里有一个非常重要但很容易被忽略的思想:Regime 的识别不是为了完美拟合历史,而是为了给未来预测创造一个可学习的目标。 这意味着,第一步的好坏,不应只用样本内聚类误差来衡量,而要看它是否为第二步提供了稳定、清晰、可泛化的标签。本文的方法之所以有说服力,恰恰在于作者始终把这一步放在整个投资闭环中理解,而不是把它当成一个孤立的聚类任务。

识别特征为什么要极简:先把标签定义“干净”

在具体实现上,作者对 Jump Model 的输入做了一个非常克制的设计:只使用极简的历史收益特征。文中用于样本内 Regime 识别的特征集列在 Exhibit 3 中,本质上只有一组东西——经过不同平滑窗口处理的 realized return。

这一步设计看似简单,实则非常讲究。很多机器学习框架的本能做法,是在一开始就向模型喂入尽可能多的变量,似乎变量越多、信息越全,模型就越有机会挖掘复杂结构。但作者并没有这样做。原因在于,Jump Model 负责的是“定义状态”而不是“拟合一切”。如果在这个阶段就引入过多特征,那么 Regime 的边界很容易被多重共线性、噪声和局部统计异常所扰动,最终得到的标签会变得模糊、不稳定,甚至在不同滚动窗口之间失去一致性。

因此,作者有意识地让 Jump Model 只关注最核心、最局部、最直接的信息:这组策略之间最近一段时间的相对表现是否出现了可持续的变化。在这种思路下,简单不是缺点,而是一种方法自律。它让 Regime 的定义尽量贴近作者真正关心的对象——策略相对收益本身——而不是被宏观变量、波动率变量、利差变量等“解释性特征”过早裹挟。

从问题定义上讲,这一步相当于明确了一个优先级顺序:

第一,先让 Regime 是“配置相关的”;

第二,再让 Regime 是“可解释的”。

如果一上来就混入大量解释性变量,虽然表面上看似更宏观、更丰富,但实际上很可能使标签本身变得不再聚焦于配置。这也是作者与许多既有 regime forecasting 文献拉开差异的关键所在。

换句话说,本文在第一步里做的,不是“尽量多看一点信息”,而是“尽量少掺杂无关信息”。这是一种非常值得注意的设计哲学:在定义标签时,信息越纯越好;在做预测时,信息越丰富越好。

λ为什么是整个框架的核心参数

在本文所有方法细节中,最值得单独拿出来讨论的就是 Jump Model 里的 (λ)。如果说整个框架的有效性建立在“状态既要存在,又要可预测”之上,那么 (λ) 实际上就是决定这两者平衡点的总开关。

从数学上看,λ) 控制的是状态切换的成本;从金融上看,它控制的是模型愿意把多大程度的收益变化解释为“结构变化”,又愿意把多大程度的波动视为“短期噪声”。(λ) 太小,意味着模型对短期变化极其敏感,每次收益相对强弱一发生逆转,就会倾向于切换 Regime。这样得到的标签虽然可能在样本内拟合得很漂亮,但问题是:它们往往缺乏持续性。对未来一天做预测时,模型面对的是一个几乎每天都在改变的目标,自然很难学到稳定关系。相反,(λ) 太大,则意味着模型对变化过于迟钝,除非相对表现发生了足够大且足够持续的偏离,否则不会轻易切换 Regime。这样虽然有助于提高标签稳定性,却又可能让模型错过真实的轮动转折点。

作者并没有停留在这一抽象讨论上,而是专门做了一个预实验来展示 (λ) 的影响。为了避免和正式样本混淆,他们选取了更早的历史区间,在不影响后续回测的前提下,对不同 (λ) 下形成的策略表现进行比较。结果体现在 Exhibit 4 中。

这张图是整篇文章方法部分最关键的实证支点之一。它清楚地表明:

  • 当使用“sign label”或 (λ) 极小、几乎不做时间正则时,策略表现明显偏弱;
  • 随着 (λ) 增加,Sharpe 比先上升;
  • 当 (λ) 进一步增大到过高水平后,Sharpe 又开始回落。

这说明,Regime 不是越灵敏越好,也不是越稳定越好,而是必须在可反应性与可持续性之间找到一个投资意义上的平衡点。作者对这一现象的解释非常有启发性:如果不加时间约束,仅根据收益当天的正负或短期变化来定义状态,那么由于金融市场中普遍存在短期反转效应,相邻两个交易日的相对收益往往很容易反复切换。于是,预测模型就会经常面对一种尴尬局面:几乎同样的输入特征,在训练样本中却被赋予了不同标签。这不仅会削弱模型的学习能力,还会使样本外预测变得高度不稳定。

换句话说,(λ) 在本文中的作用不只是“让 Regime 更平滑”,而是从根本上决定了标签是否具有可预测性。这也是为什么作者没有采用单纯的统计标准去选择 (λ),而是把它交给投资表现来检验。因为对本文而言,一个好标签的标准从来不是“分类更漂亮”,而是“是否能带来更好的资产配置结果”。

从识别到预测:为什么第二步必须换一个模型

当 Jump Model 识别出样本内 Regime 之后,问题才真正进入样本外预测阶段。此时作者采用的是 XGBoost,而不是继续沿用 Jump Model 或者直接用状态持久性假设做 naive 预测。这个选择非常重要,因为它体现了作者对“识别”和“预测”这两个任务本质差异的理解。

Jump Model 的优势在于,它适合在没有标签的情况下,从历史相对收益中找出具有时间稳定性的状态结构。但一旦标签已经有了,接下来真正的问题就不再是“这个状态长什么样”,而是“在当前时点,根据已有信息,下一期更可能落入哪种状态”。这时候,需要的就不是聚类能力,而是分类能力,而且是能够处理非线性关系、变量交互、噪声数据与类不平衡问题的分类能力。XGBoost 在这种设定下几乎是一个非常自然的选择。

更重要的是,作者在这里做出了整篇文章最关键的设计之一:将识别特征与预测特征彻底解耦。前一步用于 Jump Model 的输入特征被严格控制在极简范围内,只保留最贴近相对收益本身的信息;而到了预测阶段,作者则大幅扩展特征空间,引入更丰富的市场条件变量与统计变量,让 XGBoost 去学习“什么样的环境更容易对应哪种 Regime”。

这一点与很多现有文献形成了鲜明对比。在不少两步法框架中,第一步和第二步往往使用大体相同的特征,仿佛“识别什么”与“预测什么”可以共享同一套信息。但本文明确反对这种做法。因为从功能上看,这两步的目标根本不同:

  • 识别阶段要做的是定义一个配置意义清晰的状态,因此要克制、要纯粹;
  • 预测阶段要做的是尽可能利用所有有用信息来提高命中率,因此可以更丰富、更宏观、更统计。

这其实是一种非常成熟的系统设计思路:每一个模块只做自己最擅长的事。Jump Model 不负责解释宏观环境,XGBoost 也不负责定义 Regime;前者定义问题,后者学习条件。正是因为这种分工清晰,整个框架才具有比“混在一起做”更强的可解释性和稳健性。

预测特征:从局部收益扩展到市场环境

用于 Regime 预测的特征集列在 Exhibit 6 中。与 Exhibit 3 的极简风格相比,这里明显丰富得多。作者纳入了多类变量:包括 long-short return 的指数平滑值、下行偏差、VIX、Beta、10 年期与 2 年期收益率利差、10 年期与 3 个月收益率利差等。

从特征结构上看,这一阶段的信息被分为两类。一类是策略相关特征,例如某个因子相对基准或某对互补因子的 long-short 收益,以及其不同尺度下的 EWMA 和 downside统计;另一类是市场环境特征,例如 VIX、收益率曲线利差、Beta 等。这两类信息共同作用,使模型既能看到“这组策略自身最近发生了什么”,也能看到“市场环境目前长什么样”。

这种设计的意义在于,它把本文的 allocation-focused regime 从一个纯收益分段问题,扩展成了一个“收益相对关系如何被市场环境调制”的预测问题。换句话说,Jump Model 负责回答“历史上哪些阶段可以被定义为某种占优状态”,而 XGBoost 负责回答“今天的市场条件,看起来更像是历史上的哪一类状态即将再次出现”。

这也是本文能够在后续章节里进行经济解释的基础。因为如果预测模型只吃相对收益本身,那么虽然可能也能做出一些样本外判断,但很难进一步解释“为什么在这个阶段动量更可能占优”“为什么价值在某些环境里更容易跑赢成长”。正是因为加入了市场环境变量,作者后面才能对不同 Regime 做 ex-post characterization,并把机器学习预测结果与宏观金融直觉重新连接起来。

实证展开:从主动因子配置到互补因子轮动

在前两部分中,本文的方法框架已经搭好:先用 Jump Model 在样本内识别 allocation-focused regime,再用 XGBoost 在样本外预测 regime,最后通过验证集上的风险调整收益来选择关键超参数。接下来真正决定这篇文章价值的,是作者如何把这套框架用在具体投资问题上,以及它是否真的能在长期历史中稳定地产生更好的配置结果。

作者的实证分成两个主场景。第一个场景是主动因子配置(active factor allocation),其核心目标不是完全脱离市场,而是在一个基准组合之上,动态判断“当前是否值得偏离基准去押注某个因子”。第二个场景是互补因子轮动(complementary factor allocation),即在一对相互对照、具有某种对立关系的因子之间进行切换,例如动量与反转、价值与成长、大盘与小盘。前者更接近主动管理人相对基准获取 alpha 的问题,后者则更接近风格轮动和因子择时问题。作者通过这两个场景,试图说明 allocation-focused regime 不只是一个概念,而是一种可以跨策略结构迁移的配置工具。

(一)主动因子配置:不是判断市场方向,而是判断“是否值得偏离基准”

主动因子配置部分的逻辑非常清晰。对每一个因子,作者都把它放在一个“相对基准”的框架中去看:不是问“这个因子本身未来涨不涨”,而是问“它未来是否会跑赢一个等权基准(EW benchmark)”。这一步看似只是换了一个比较对象,但实际上非常重要,因为它让 Regime 的定义从绝对收益问题,变成了一个更接近真实资产管理的相对收益问题。

具体来说,对于某个因子(例如 momentum),作者先构造它相对 EW 基准的收益差序列,然后在训练窗口中用 Jump Model 把这段历史划分为两类 regime:一类是该因子相对基准占优的时期,另一类是其相对基准落后的时期。之后,再用 XGBoost 根据更丰富的预测特征,去预测下一天更可能属于哪种 regime。如果模型判断该因子进入占优 regime,那么组合就完全配置到该因子;如果判断其处于劣势 regime,则回到基准组合。换句话说,active strategy 的本质不是“永远持有因子”,而是“在因子值得持有时才偏离基准”。

文中对这一过程给出了一张非常直观的示意图,以主动动量策略为例,展示了 Jump Model 在样本内识别出来的 regime 动态。

这张图的作用不只是视觉化,而是帮助读者真正理解本文的 active framework:作者并没有试图把市场一天一天地切成散乱的标签,而是在构造一种具有连续性的“相对优势阶段”。这和前面方法部分强调的 (\lambda) 作用正好呼应——如果没有持续性约束,这种 regime 图会变得极其零碎,后续预测也就没有意义。

在样本外回测中,作者使用 1970–2024 年的数据,并设置了相对严格的滚动训练结构:10 年用于 regime identification,4 年用于验证和参数调优,之后按季度更新模型,并对未来约 63 个交易日做预测。这个滚动窗口设计使得结果更接近真实投资流程,而不是一次性看完整个历史数据后得出的“后见之明”结论。此外,作者在回测中显式加入了 5bp 的单边交易成本,这一点也很重要,因为动态配置策略如果不考虑交易成本,很容易把看似漂亮的择时能力夸大。

真正的结果集中体现在 Exhibit 7 中。

从这张表中可以看到,active strategy 最稳健的提升集中体现在两个方面:信息比率(IR)和Sharpe 比。几乎所有因子的 active 版本,相比对应的 passive 持有版本,都表现出更好的相对收益质量。也就是说,这套 regime-aware 的框架确实帮助组合更有效地“挑选那些值得主动偏离基准的时段”。这并不意味着每一个因子的绝对收益都发生了剧烈跃升,但它确实说明:当目标被定义为“相对基准获取更优风险调整后收益”时,allocation-focused regime 是有效的。

同时,作者也没有回避一个重要事实:active strategy 并没有显著降低回撤。这个结果其实非常有启发性,因为它提醒我们,这套方法的设计目标不是“躲灾难”,而是“增强相对收益”。如果投资者真正关心的是极端下行保护,那么基准就不应设置为等权股票组合,而应该设置为更低风险的持有对象,例如现金、短债或风险更低的防御性资产。这一点作者在文中也明确提到:本文的主动因子框架主要是服务于相对收益增强,而不是服务于绝对回撤控制。换句话说,它更适合作为一种 alpha overlay,而不是一个完整的风险管理系统。

但如果只看到绩效提升,还不足以说明 allocation-focused regime 的价值。本文另一个非常值得称道的地方,是作者进一步做了 regime 的事后经济解释。他们没有满足于说“机器学出来了有效信号”,而是反过来问:这些 regime 出现时,市场通常长什么样?相关分析体现在 Exhibit 8 中。

这一部分非常关键,因为它把 allocation-focused regime 从“能用的黑箱信号”进一步推进为“可解释的市场结构”。例如,动量因子在低 VIX 环境下更容易跑赢基准,这很符合投资直觉:在波动较低、趋势更容易延续的环境中,追逐赢家往往更有效;而反转因子则在高波动环境下更占优势,这同样容易理解,因为高波动时市场更容易出现过度反应与价格偏离,均值回归空间更大。类似地,成长因子在低信用利差、较乐观的信用环境中更占优,而价值因子则往往在更紧张、风险偏好下降的环境中相对更能跑赢。

这些结果说明,allocation-focused regime 虽然不是从宏观变量直接定义出来的,但它最终仍然能够与宏观金融逻辑相互印证。换句话说,本文并不是在用机器学习替代经济解释,而是在用更贴近配置目标的状态定义方式,反向提取出“哪些市场条件更有利于哪类策略”的结构性知识。

(二)互补因子轮动:从“相对基准”转向“因子对之间的切换”

如果说主动因子配置解决的是“某个因子相对基准是否值得持有”的问题,那么互补因子轮动解决的则是一个更纯粹、也往往更容易产生结构性 alpha 的问题:在两种互补风格之间,当前更应该偏向哪一方?

作者选择了三组互补因子:

Momentum 与 Reversal

Value 与 Growth

Large 与 Small

这些组合的共同特征是:它们不是完全独立的资产,而是在同一股票市场中代表不同甚至相反的风格假设。动量与反转是最典型的对立:一个押注趋势延续,一个押注均值回归;价值与成长代表对“低估值”和“高成长预期”的不同偏好;大盘与小盘则体现了对稳健性和高弹性的不同偏好。正因为它们不是简单平行的因子,而是具有明显的“替代关系”,所以 allocation-focused regime 在这里的用武之地反而更大。

在方法上,这一部分与前面的 active strategy 保持一致。作者先对一对互补因子的收益差做 Jump Model 分段,例如对 momentum 和 reversal,构造 (),再在样本内识别“动量占优”与“反转占优”的 regime。随后,用 XGBoost 对未来 regime 做样本外预测,并将每日的预测结果直接转化为组合切换:如果预测进入动量 regime,则持有 momentum;如果预测进入反转 regime,则转而持有 reversal。这个过程也有一张图来帮助读者理解样本内状态如何被识别出来。

与主动因子配置相比,这种策略在概念上更“干净”。因为它不再需要与一个广泛基准比较,而是只关注一对候选对象之间的相对优劣。这一点非常重要。作者在后文的结果实际上也证明了这一点:互补因子轮动策略的表现整体优于主动因子配置策略。从问题难度上理解,这并不令人意外。预测“某个因子是否跑赢整个市场基准”本身就是一个更复杂的问题,因为市场基准融合了多种风格和风险暴露;而预测“一对互补风格中谁更优”,则更接近一个局部排序问题,信号更集中、噪声更小。

在预测特征上,作者依旧采用了“局部收益 + 市场环境”的混合结构,并在文中专门列出互补因子配置所用的特征集。

随后,作者给出了最直观的一组结果图,即不同互补因子策略在样本外的 regime 预测与财富曲线对比。

这些图非常值得细看。它们不仅展示了策略表现优于单独持有某一个因子,更重要的是让人看到 regime 切换与市场历史阶段之间的对应。例如,在 2010 年以后较长的一段时间中,成长风格在科技龙头驱动下持续占优,value–growth 的切换策略如果能够识别这一点,就会自然把配置偏向 growth;而在某些波动显著抬升、风险偏好变化较快的阶段,momentum 与 reversal 之间的切换会更频繁,对应的是趋势与反转逻辑在市场中的主导权轮动。

如果说 Exhibit 11 给出的是图形直觉,那么真正系统的绩效比较则在 Exhibit 12 中。

从结果看,三组互补策略几乎都显著优于各自单独持有的因子,尤其在 Sharpe 和 Sortino 上表现突出。这一点非常关键,因为它说明本文提出的框架并不仅仅在“有基准可对照”的 active setting 下有效,在“纯风格切换”的 setting 下反而更有优势。换句话说,allocation-focused regime 最自然的应用场景,也许并不是简单增强某个因子,而是在一组互补关系明确的因子中做动态路由。

从投资逻辑上讲,这里的 alpha 来源已经非常清晰:它不是来自新因子,也不是来自更高杠杆,而是来自在互补因子之间更及时地切换暴露。这是一种非常纯粹的、结构性的 alpha。

与主动因子配置一样,作者也对互补因子策略进行了事后市场环境分析,结果列在 Exhibit 13 中。

这张表进一步巩固了一个重要观点:allocation-focused regime 虽然起点是策略相对表现,但终点并不是抽象统计标签,它与真实市场环境是可以相互映射的。例如,reversal 相对 momentum 更占优的阶段,通常伴随更高的波动环境;value 相对 growth 更占优的时期,往往伴随更高的利率和更高的信用利差;small 相对 large 的优势,则更容易出现在融资条件友好、风险偏好改善的环境中。这些事实说明,本文的方法虽然没有直接用宏观变量“定义” Regime,但最终识别出的状态并不是脱离经济现实的。

(三)多因子组合:从单对切换到组合层面的系统收益

在完成主动因子配置和互补因子轮动两类单策略实验后,作者进一步走到组合层面。毕竟,对真实投资者而言,最终关心的不是单个因子信号能否有效,而是这类信号能否在组合中以一种稳定、可扩展的方式存在。

作者因此构建了两类多因子组合。第一类是将多个 active factor strategy 组合起来:对每一个因子先判断其是否处于 outperformance regime,若是则赋予权重,否则不给权重,然后对被选中的 active exposures 等权组合。第二类则是将三组 complementary strategy 组合起来,每组互补因子之间先做 regime-aware 切换,再将三组结果等权叠加。最终,再把这两类组合与等权因子组合(EW)以及 S&P 500 做比较。

这一部分的总结果图体现在 Exhibit 14 中。

这张图几乎可以被看作全文最有总结性的图表。它表明,无论是 active factor 组合还是 complementary factor 组合,长期都显著优于简单的等权因子组合和 S&P 500。更值得注意的是,complementary factors 组合整体又优于 active factors 组合。这一结果与前面的单策略结论完全一致,也从组合层面再次说明:相比“预测某个因子是否跑赢市场”,预测“互补因子中谁更优”往往是一个更可控、可持续的任务。

对应的详细绩效表则列在 Exhibit 15 中。

从这张表中可以清楚看到,complementary factors 组合拥有最高的 Sharpe 和 Information Ratio,而 active factors 组合也明显优于 EW 与市场基准。这意味着,allocation-focused regime 并不是一种只能在单一策略上做出一点 marginal improvement 的工具,而是可以在组合层面形成系统性收益增强。更进一步说,它提供的不是单一信号,而是一种新的组合构建逻辑:组合不再只是静态地持有一篮子因子,而是动态地路由到更合适的风格暴露上。

这实际上是本文实证部分最值得重视的结论之一。它隐含地挑战了传统多因子投资中的一个常见默认假设:只要选对了一组长期有效的因子,简单等权长期持有就是一个合理起点。本文的证据表明,这样的想法至少不是最优的。因子本身固然重要,但更重要的,也许是这些因子之间的关系、轮动和相对强弱。换句话说,真正的 alpha 不仅来自“选因子”,更来自“选时机、选关系、选相对位置”。

如果把本文再往真实的机构投资流程推进一步,它最自然的延伸,其实并不是停留在“预测哪个因子下一阶段更强”,而是进一步进入“如何把这种判断稳定地落到组合中”这一层面。也就是说,allocation-focused regime 解决的是“下一步更该配谁”的问题,但一旦组合真的开始偏离基准,投资者马上还会面对另一个同样重要的问题:当前组合究竟新增了哪些风格暴露、承担了哪些额外风险、这种偏离是否仍在可接受的风险预算之内。从这个角度看,本文的方法更像是一个信号层,它负责识别和预测风格切换的方向;而像 MSCI Barra 这样的多因子风险模型,则更像是一个风险表达与约束层,它不直接回答“谁会跑赢”,却能够用统一的风格语言和风险坐标系,把这些配置意图转化为可监控、可解释、可归因的组合表达。对于真正做风格轮动和动态因子配置的机构投资者而言,这种分工其实非常自然:regime 框架帮助提升风格切换的命中率,而 Barra 这类风险模型帮助确保这种切换能够以更稳健、更透明的方式落地。

总结

读到这里,本文的贡献已经相当清楚。它并不是简单提出了一个新的择时模型,也不是又一次在“市场状态识别”这一老问题上增加了一个算法变体。它真正做的,是把 Regime 从一个偏解释性的概念,改造成了一个直接服务于配置的问题定义。

从方法上看,本文最值得称道的是三点。

  • 第一,Regime 的定义被重新锚定在策略相对表现上,使其天然与投资决策相连。
  • 第二,作者对识别与预测的功能做了非常清晰的解耦:Jump Model 负责定义清晰、稳定的状态,XGBoost 负责利用更丰富的信息去预测这些状态。
  • 第三,参数选择不是围绕统计拟合,而是围绕最终策略表现来进行,这使整个框架从一开始就站在投资者的目标函数上。

从实证上看,文章并没有只展示某一个孤立策略的短期亮点,而是通过主动因子配置、互补因子轮动以及多因子组合三个层次,证明了 allocation-focused regime 既可以提升相对基准的表现,也可以在互补风格之间做出更有效的切换,并最终在组合层面形成稳定优势。尤其是互补因子部分的结果,非常有说服力:它表明最有价值的预测,很多时候并不是“市场会不会涨”,而是“在几个候选风格中,谁更值得配”。

当然,这篇文章也不是没有局限。它的 regime 定义主要建立在成对比较上,因此在更高维度的多资产、多策略排序问题上,如何扩展仍然是一个开放问题;它的方法虽然较为清晰,但在真实交易中仍需面对更复杂的约束,例如容量、冲击成本、执行时点和风险预算;此外,allocation-focused regime 的有效性在不同资产类别、不同市场结构中是否同样成立,也仍值得进一步验证。

但即便如此,这篇文章依然提供了一个非常值得吸收的思想:

投资中的 Regime,不一定非要描述市场本身;它完全可以被定义为“谁更值得配置”。

这句话听起来简单,却意味着整个投资建模视角的一次移动。它把问题从“理解世界”推进到“做出选择”,也把机器学习从解释层推进到了决策层。对于因子投资、动态配置乃至更广义的多策略投资而言,这都是一个非常有价值的方向。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档