量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。 来自:Financial Analysts Journal 标题:Is Sector Neutrality in Factor Investing a Mistake? 作者:Sina Ehsani、Campbell R. Harvey、Feifei Li
想象一下,有一家科技公司,它的账面市值比(Book-to-Market Ratio,简称BM)在科技行业内算是比较高的,但如果和非科技公司比起来,它的BM就不算高了。尽管在科技行业内部,这家公司可能被视为价值型公司,但如果我们按照BM来排序,可能会选择卖空它,因为科技行业的公司普遍BM较低。
在这个例子中,整个市场中BM的预测能力来自于两个方面:一是行业BM可以预测行业内的回报情况,二是公司特定的BM可以预测公司自身的回报情况,或者是这两方面的结合。换句话说,一个按照BM排序的投资组合的回报,来自于两个部分:一部分是它的行业暴露(即它在特定行业中的投资比例),我们用 表示;另一部分是行业中性化的部分(也就是公司特定的那部分),我们用 表示;那么该因子的总收益:
简单来说,就是一家公司的价值不仅取决于它在同行业公司中的比较,还取决于它自身的特性。投资者在构建投资组合时,会同时考虑公司所在行业的整体情况和公司本身的表现。
如果一个公司的账面市值比(BM)的内部部分(即与同行业其他公司相比的部分)比整体部分(即与所有行业相比的部分)更能准确预测回报,那么基于内部部分进行交易会比基于整体部分进行交易更有利可图,我们就会说内部部分的夏普比率()大于整体部分的夏普比率()。
问题来了:一个追求均值-方差最优(即在给定风险下追求最大回报,或在给定回报下追求最小风险)的投资者,是应该使用原始的包含这两个部分的BM因子,还是只使用更能准确预测回报的那个部分进行投资呢?
简单来说,就是如果我们知道一家公司在它所在行业中的BM值相对于其他公司来说更能预示它的股票表现,那么我们就应该更多地依赖这个信息来做出投资决策。投资者需要权衡的是,是使用一个包含了可能有用的、但也可能有噪声的信息的复杂因子,还是只使用一个更纯净、更直接的因子。这需要通过分析不同因子所产生投资组合的表现来做出选择。
我们可以将基于预测因子(例如行业账面市值比BM)进行交易所形成的投资组合视为一种资产。并求解组合最优时across部分的权重如下等式:
这个条件是基于均值-方差优化理论,用来决定是否应该在投资组合中考虑某个特定的风险因素,比如行业风险。在均值-方差框架下,投资者希望在给定风险水平下最大化预期回报,或者在给定预期回报下最小化风险。
当我们谈论“冗余”时,我们指的是在一个投资组合中,是否可以移除某个风险因素而不损失预期回报,或者至少不会显著增加风险。作者认为当行业间信号的夏普比率与内部信号的夏普比率的比值小于它们之间的相关系数时,行业间信号会被认为是冗余的:
1、如果行业间信号的夏普比率较低,这意味着相对于它带来的风险,它提供的超额回报较少。
2、如果两个信号之间的相关系数较高,这意味着它们提供的信息在很大程度上是重复的,即行业间信号提供的关于预期回报的信息已经在内部信号中被捕捉了。
3、当行业间信号的夏普比率与内部信号的夏普比率的比值小于它们之间的相关系数时,这意味着行业间信号不仅提供较少的超额回报,而且它提供的信息已经大部分被内部信号所包含。
4、在这种情况下,包括行业间信号可能不会给投资组合带来额外的价值,反而可能增加不必要的风险,因为它引入了与内部信号高度相关的额外波动。
因此,如果行业间信号的夏普比率相对于内部信号的夏普比率较低,并且两个信号之间的相关性较高,那么在追求均值-方差效率的情况下,行业间信号可以被认为是冗余的,投资者可能会选择忽略它,从而实现行业中性。这样做的目的是为了构建一个更有效(风险调整后回报更高)的投资组合。
按照 Ehsani, Hunstad, 和 Mehta (2020) 的方法,我们用 C 表示因子,用 r 表示回报,并用下标 s 和 n 分别表示行业和股票。一个行业 s 的平均因子值和平均回报是:
其中 N 是行业 S 中股票的数量,而 和 分别是行业 S 中股票 N 的因子和回报。标准因子的回报是:
其中 S 是行业的总数,C 是横截面上因子的平均值,定义为:
行业中性化因子根据股票的因子相对于行业 S 的平均因子进行投资。因子的回报是:
其中 是行业 S 的因子评分。我们将因子回报分解如下:
进而得到如下等式:
我们使用美股数据进行实证分析,对收益按以上方式进行拆解。表1通过展示多空(long-short)和纯多(long-only)策略下的因子投资在考虑行业暴露时的夏普比率和相关系数,深入探讨了行业中性化在因子投资中的潜在价值。表中数据揭示了不同因子策略对于行业中性化敏感性的差异。
在多空策略中,表中数据显示,行业间(across)成分的夏普比率通常低于行业内(within)成分的夏普比率,但两者之间的相关性较高。这表明,多空投资者可能会从行业中性化中获益,因为通过减少行业特定风险,可以提高投资组合的风险调整后回报。
而在纯多策略中,行业间和行业内成分的夏普比率相差不大,有时行业间成分的夏普比率甚至超过了行业内成分的夏普比率。这意味着,对于纯多投资者来说,行业中性化可能不会带来显著的优势,因为长期持有的股票已经自然分散了行业风险。
此外,表中数据还显示,不同因子对行业中性化的反应不同。例如,价值因子在多空策略中从行业中性化中获益,而在纯多策略中则可能不受益。这强调了在实施行业中性化策略时,需要根据因子的特性和投资者的风险偏好进行定制化决策。
表2通过对比多空(long-short)因子和纯多(long-only)因子的回报分解,深入阐释了行业中性化在因子投资策略中的应用和影响。在多空策略中,Table 2 显示了行业内因子(within component)相对于行业间因子(across component)在产生正回报方面的效率更高。
相反,在纯多策略中,表2揭示了行业间因子同样为投资组合的总体回报做出了积极贡献。这一点对于纯多投资者尤为重要,因为他们无法通过卖空来对冲行业风险。因此,纯多投资者可能会发现,保持一定的行业暴露比完全中性化更能提高投资组合的表现。
表3显示,行业内因子(within component)在每个行业上都是正回报,且总体贡献显著。这意味着,在同一行业内,基于公司特定属性的因子能够更有效地识别出表现较好的股票。这强调了在多空策略中,利用行业内的差异化信息可能比行业间的整体趋势更为重要。此外,文章指出,尽管行业间因子(sector component)在预测行业表现上可能有所帮助,但在构建多空价值因子时,这种因子往往会被噪声所干扰。换句话说,行业间的因子可能会掩盖行业内的有用信息,导致投资组合的整体效率降低。
表4我们可以看到尽管行业间因子(sector component)对纯多价值因子的总体回报有贡献,但表4也揭示了行业内因子(within component)的重要性。行业内因子在多个行业中同样显示出正回报,这表明在纯多策略中,投资者不仅可以从行业层面的暴露中获益,还可以从行业内的公司特定因子中获得额外的价值。
在图5中,我们可以看到,对于多空策略,行业中性化在不同的行业分类下通常是有益的。图中显示,大多数多空策略在进行行业中性化后,其夏普比率有所提高,这表明通过减少行业特定风险,多空投资者能够提升投资组合的风险调整后回报。
相比之下,图6展示了对纯多因子进行行业中性化的影响。图中的数据显示,纯多因子的夏普比率在行业中性化后普遍降低,这意味着纯多投资者可能会因为剔除行业风险而损失一些潜在的回报。
图7和图8通过展示多因子投资组合中因子的截距(intercepts)来进一步阐释行业中性化的影响。这些图表中的截距是在多元回归分析中得到的,它们表示了在控制了其他因子后,每个因子投资组合的超额回报。
在图7中,当使用多空策略进行多元回归时,我们可以看到大多数标准因子(即未进行行业中性化的因子)的截距为负,而行业中性化的因子的截距大多为正,并且价值和盈利能力因子的截距统计显著。这一结果表明,在多因子投资组合中,行业中性化的多空策略能够提供额外的价值,即它们在考虑了其他因子后仍然能够带来正的超额回报。
图8则关注纯多因子。在这些回归中,所有版本的标准纯多因子都显示出正的截距,而行业中性化的因子中有一部分显示负的截距。特别是,规模和盈利能力因子的行业中性化版本,以及价值加权的价值和动量因子的行业中性化版本,都显示出负的alpha值。这表明在纯多策略中,行业中性化可能会减少投资组合的超额回报。