【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)


策略失效问题探索

对比同时段使用的CAPM策略,可以看出选取市场低估(α较小)的投资组合建仓是较为有效的。而在Fama French五因子策略中,我们遵循同样的选股原理,结果却相差甚远。因此,我们认为五因子模型表现不佳的原因是期在近三年间对于沪深300的解释性较差,因此没能捕捉到α收益,而并非获取α收益的策略无效。

净值曲线(4)使用CAPM模型获取的α值最小的60支股票(第1组)
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

针对此问题,接下来探索五因子模型效果不佳的潜在原因及解决方案:

  1. 使用α解释超额收益不恰当。
  2. 没有按时更新沪深300成分股
  3. 因子间存在明显多重共线性问题。

问题1:使用α解释超额收益不恰当
实践过程中,有些量化交易者使用了回归的残差——而非α值来表示超额收益。使用残差来表示超额收益的逻辑在于捕捉那些没能被模型所解释的收益,以此作为超额收益,进行选股。接下来,我们对此观点进行尝试,判断此方法是否有效。

计算残差的步骤为:

  1. 使用所有因子乘以回归所得因子荷载,计算模型的预测收益率。
  2. 使用真实收益率减去预测收益率,得到残差序列。
  3. 计算每只股票每个月残差序列的平均值,作为本月的残差值。
  4. 遵循α值选股的相同策略,分别选择不同残差值范围的股票建仓

使用残差代表超额收益得到的三组投资组合在回测时间内的净值表现如下图所示:

净值曲线(5) 残差值最小的60支股票(第1组)
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

净值曲线(6) 残差值位于第121-第180名的60支股票(第2组)
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

净值曲线(7) 残差值最大的60支股票(第3组)

【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

从上图中我们可以看出,尽管残差最小的组合没能在三年全部时间内跑赢大盘,但不同残差值的投资组合确实展现出了差异较大的净值表现,l投资组合累计收益从残差最小至残差最大的组逐渐下降。为了更清晰的展示这一表现,同样将三条净值曲线与基准指数表现绘制在同一幅图中。

【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

从上图可以看出,大部分时间内第1组的表现都要优于第2组,而第2组的表现在大部分时间内也优于第3组。加上累计收益的递减性,可以说使用残差获取超额收益比使用α值获取超额收益获得了更好的效果。

问题2:没有按时更新沪深300指数成分股
无论是使用α或者残差来表示超额收益,我们都观察到组合在前一年半时间内的表现明显高于后一年半的表现,因此考虑是否是选股池有问题所导致。沪深300每半年更新一次持仓,而本策略只在2018年策略执行之初调取沪深300成分股代码并保持该标的池不变。为保证选股池的股票质地优良,我们应持续更新沪深300的成分股。

一般来说,沪深300成分股在每年一月及七月的第一个交易日更换,每次更换幅度不超过10%,但换仓的时间并不固定。为了不错过每次换仓,每个月初策略执行时都重新获取沪深300成分股代码,并以此作为本月策略换仓的标的池。

加入成分股更新条件后,投资组合净值表现如下图所示:

净值曲线(8) 指数换仓 残差值最小的60支股票(第1组)
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

净值曲线(9) 指数换仓 残差值位于第121-第180名的60支股票(第2组)
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

净值曲线(10) 指数换仓 残差值最大的60支股票(第3组)

【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

对比沪深300按时换仓与不换仓的净值曲线,很明显,进行换仓后,投资组合的净值变化与市场净值变化更加贴合,投资组合也收获了更高的回报率。同时,不同投资组合的累计收益仍然呈现出残差越小,收益越高的趋势。

问题3:因子间存在明显多重共线性问题
不同于CAPM只使用市场组合作为因子,由于五因子模型中有五个因子,进行回归时,需要考虑各因子间的线性相关性,即是否会出现多重共线导致模型表现不佳的问题。如果存在多重共线问题,会导致组合整体在某些因子上的重复暴露,从而影响组合的长期表现。因此,有必要对因子进行正交化,基于正交后的因子模型可以提升组合长期表现的稳定性。

为了验证本策略使用的五因子模型是否存在多重共线性问题,分别将五个因子作为因变量,其他四个因子作为自变量进行回归,检验回归的t检验值,和模型�2R2。假如存在多重共线问题,那么将存在问题的因子的共线部分去除。

下列五次回归皆使用2018至2020年三年的数据进行操作。结果如下:
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

通过观察上述五张表格的t值及R2值,其中以规模因子为因变量,其余四个因子为自变量的模型解释性最强, R2达到了0.714,而分别以其他三个因子为因变量的模型R2也都达到了0.6以上,且t值全部显著有效。观察发现,规模因子与盈利因子、估值因子与投资因子间的t值较大,对于模型解释力有着较大的影响。因此,考虑将盈利因子、投资因子做正交化处理。

除回归观察R2与t值外,还可以使用相关性矩阵来判断因子间的相关性。
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

从相关性矩阵中,也可以看出规模与盈利因子、估值与投资因子间的相关性较强。这再次认证了因子正交化是有必要进行的。

使用Gram-Schmidt(格拉姆-施密特)正交化处理方式将五个因子两两正交化处理。

通过盈利因子与投资因子正交化处理后,五因子模型变为:

【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

正交化处理后的因子相关性矩阵变为:
【点宽专栏】验证Fama French五因子模型在中国市场的表现(下)

经过因子正交化处理后,发现三个投资组合的净值表现都与因子正交化处理之前的模型完全一致,没有任何变化。这表明因子正交化后每个月模型所筛选出的股票与正交化前完全一致。

出现这种情况的原因是正交化的效果较弱,可能对于个股的单天预期收益率的残差值有影响,但平均来看,对于一个投资周期(即一个月)内一只股票的残差平均值影响不大,因此并没有影响到选股标的的选择。


总结

经过验证,使用回归所得五因子模型的α值作为超额收益的判定标准并以此建立持仓在近3年表现不佳;而使用模型预测收益率值与真实收益率值的残差为标准构建投资组合效果较为优良。同时,由于指数持续更新,策略选股范围跟随指数进行更新所得收益明显大于不跟随指数进行更新。尽管通过分析发现规模与盈利因子、估值与投资因子间的相关性较强,但使用正交化后的因子建模并没能收获更好的效果。

(END.)

上一篇:Silfab solar将推出300Wp60片电池太阳能光伏组件


下一篇:《数据科学:R语言实现》——1.6 理解闭包