多因子回归检验中的NeweyWest整

2024-02-07 18:14:05

作者：石川，量信投资创始合伙人，清华大学学士、硕士，麻省理工学院博士；精通各种概率模型和统计方法，擅长不确定性随机系统的建模及优化。知乎专栏：https://zhuanlan.zhihu.com/mitcshi。未经授权，严禁转载。

摘要：Newey-West 调整是计量经济学中的经典方法，在多因子模型回归分析中无处不在。本文介绍它的用法。

1、引言

本文有很多数学公式。

本文的推导重点参考了 William Greene 的经典教材 Econometric Analysis（Greene 2003，我用的第五版，最新的出到了第八版）。

本文回答了一个曾让我纠结很久的问题。

在学术界关于 empirical asset pricing 的论文中，portfolio test 和 regression test 是检验一个新因子是否有效的两个常见手段。在前者中，使用已有因子的收益率作为 regressors、使用基于新因子构建的投资组合的收益率作为被解释变量，进行时序回归，从而检验新因子组合是否可以获得超额收益 α、以及它在已有因子上的 β。在后者中，新因子和已有因子一起被用来和个股收益率进行截面回归（通常使用 Fama-MacBeth regression），然后考察新因子的预期收益率 E[f] 是否显著不为零。

无论是上面哪种方法，学者们都会对回归分析得到的 α、β 以及 E[f] 给出 t-statistic 从而检验它们的显著性。而在学术论文所报告的结果中，经常出现诸如“Newey and West adjusted t-statistic”或者“Newey and West adjusted standard error”（standard error 是用来计算 t-statistic 的）这样的描述。这不禁让人疑问：回归检验中的 Newey and West 调整到底是什么？

除了要搞懂它到底是什么之外，我们也关心它是如何实操的，这样才能将它用在 A 股的实证研究中。这就是本文关心的话题。本文的内容提要如下：

第二、三节介绍必要的数学背景，解释 Newey-West 调整的重要性。

第四节针对 A 股进行 portfolio test 的实证研究，指出考虑 Newey-West 调整后 α 和 β 的显著性的变化。

第五节说明通过 Fama-MacBeth regression 求解因子预期收益率 E[f] 中的 Newey-West 调整是一种简化版。

第六节总结本文，并评论一下 Barra 在计算协方差矩阵中的 Newey-West 调整。

让我们从广义线性回归说起。

2、广义线性回归

考虑如下广义线性回归模型（generalized linear regression model）：

上述模型是时序上的线性回归模型；其中 y 是 T × 1 阶向量（T 代表时序的总期数）；X 是 T × K 阶矩矩阵（其中 K 是 regressors 的个数）；ε 是 T × 1 阶残差向量；Σ（T × T 阶）是残差的协方差矩阵。回归的目的是为了得到回归系数 β（K × 1 阶矩阵）并检验它们的显著性。

上述模型和经典线性回归模型最大的区别是矩阵 Ω 的引入。在经典模型中假设给定解释变量 X 下，不同时刻 t 的残差是独立且同方差，因此 Ω 是单位阵 I。

在广义线性回归中，残差独立、同方差这两个假设均可被打破，从而得到两个残差中常见的特性：异方差（heteroscedasticity）和自相关（autocorrelation）。多因子模型回归中的残差就经常呈现上述两种特性。在广义线性回归模型中引入 Ω 正是为了反映上述特性。以下是两个例子。

对于异方差（但仍可以假设独立），通常有：

对于自相关（但同方差），通常有：

当然我们也可以既考虑异方差又考虑自相关性。在一般情况下 Ω 矩阵中第 i 行、第 j 列的元素用 ω_{ij} 表示。

如果 Ω 已知，则通常使用 generalized least squares 来对 β 进行参数估计。但当 Ω 未知时，OLS 往往是首选。对该广义线性回归模型进行 OLS 求解就可以得到 β 的 OLS 估计，记为 b：

对上式两边取期望，则当 E[ε|X] = 0 的假设成立时易知 E[b] = β。利用 E[b] = β进而推导出 b 的协方差矩阵，记为 V_OLS：

当残差不存在异方差以及自相关性时，Ω = I 而上面的协方差矩阵也可以简化成我们最熟悉的经典 OLS 里面的形式，也就是各种 OLS 软件包给出的参数的标准误（协方差矩阵对角线元素的平方根）和 t-statistic 的结果。然而，当残差存在异方差或者自相关时，OLS 得到的 β 的方差的估计是不准确的，从而影响对 β 进行统计检验。

在 Ω 未知的情况下，需对V_OLS 进行估计。上面的表达式可以看成是三个矩阵相乘的形式，其中第一个和第三个仅和 X 有关，因此核心目标就是估计中间矩阵（middle matrix）。为了方便讨论，另 Q 代表中间的矩阵：

其中 x_i = [x_{i1}, x_{i2}, …, x_{iK}]’，即 X 的第 i 行的转置（注意它不等于 X 的第 i 列）。一旦我们能找到矩阵 Q 的估计，便可进而求出 b 的协方差矩阵 V_OLS。在估计 Q 时，我们需要用到的“武器”便是 regressor 矩阵 X 以及回归残差 e。

针对残差的假设不同，最常见的两种估计是 White 估计（仅假设异方差）以及 Newey and West 估计（考虑异方差及自相关）。

3、White and Newey-West Estimators

当残差仅有异方差但没有自相关时，我们需要的估计量 Q 简化为：

White (1980) 指出使用 X 以及 e 可以求出 Q 的渐进估计（记为 S_0）：

将上述 Q 的估计 S_0 代入到 V_OLS 的表达式中，可以得到 b 的协方差矩阵的估计：

上述估计称为 White heteroscedasticity consistent estimator。这一结果极其重要。它意味着哪怕我们对异方差的取值或结构一无所知，我们仍然可以根据最小二乘的结果进行适当的推断。考虑到实际问题中，多因子收益率残差的异方差性质未知，这一性质就显得格外重要。

在实际问题中，除了异方差外，仍需考虑残差的自相关性。为此，一个自然的想法是将上述 Q 的估计延伸到对角线之外的元素，即：

然而，这种方法有两个问题，因此并不正确：

1. 首先，该表达式中一共有 T^2 项求和，而它的 scaling factor 仅仅是 1/T，因此 S 可能完全不收敛；

2. 即便 S 收敛，它也很可能不是正定的，从而使得最后估计的 b 的协方差矩阵不是正定的，这显然有违常理。

怎么办呢？大名鼎鼎的 Newey and West estimator（Newey and West 1987）闪亮登场！他们给出了当残差同时存在异方差和自相关时，Q 的相合估计，记为 S：

这就是计量经济学中无处不在的 Newey-West 调整。上式中，大括号中的第一项对应仅有异方差情况下的 S_0，而后面第二项则是针对自相关性的修正。其中 L 是计算自相关性影响的最大滞后阶数（Newey and West 1994 给出了自动计算 L 取值的自适应算法），w_l 是滞后期 l 的系数，其隐含的意思是自相关性的影响随着滞后期 l 的增大而减小。在实际计算时，考虑到*度的问题，为了得到无偏估计可以将上式中大括号外面的 1/T 换成 1/(T - K)；大括号内部的求和项仍是 T 项及 L × T 项。

将 S 代入到 V_OLS 的表达式中，得到 Newey–West autocorrelation consistent covariance estimator：

在时序 OLS 回归中，Newey-West 调整同时作用于多个 regressors 的回归系数，从而求出 b 的协方差矩阵，常见于因子分析中的 portfolio test 中，具体方法为：

1. 使用目标因子投资组合的收益率序列和（多个）已有因子收益率在时序上 OLS 回归（同时带截距项，代表超额收益部分；假设已有因子 + 截距项一共 K 个 regressors），得到残差；

2. 使用截距项和已有因子收益率序列（回归中的 X）和残差 e，通过 Newey-West 调整求出 V_OLS；

3. 将 V_OLS 的对角线元素开平方，其平方根就是参数 b 的标准误（一共 K 个，对应 K 个 regressors）；

4. 使用 b 的估计和 Newey-West 调整后的标准误计算出这些参数的 t-statistics，从而判断它们的显著性。

下面来看一个例子。

4、一个例子

《寻找股票市场中的预期差》一文基于基本面和市场预期之差进行了选股。对于使用“预期差”因子构建的投资组合，该文应用一些已有因子进行了 portfolio test。假设已有因子包括 Fama and French (1993) 三因子以及 Carhart (1997) 的动量因子。这四个因子的累积收益率如下图所示。下面用这个 portfolio test 说明 Newey-West 调整。

以上述四个因子以及一个截距项作为 regressors，对“预期差”因子的投资组合在时序上进行 OLS 回归，得到残差 e。加入截距项后，X 矩阵一共有 5 列 —— 第一列全是 1，对应截距；后面四列对应 4 个已有因子的收益率时间序列。使用 X 和 e 对进行 Newey-West 调整，计算回归系数的标准误。在计算中，使用 Newey and West (1994) 自动计算滞后阶数 L：

由于实证中一共使用了 108 期月频收益率数据，因此 T = 108；由上式计算出的 L = 4。下表给出了使用经典 OLS 和使用 Newey-West 调整后得到的回归系数 standard errors 以及 t-statistics。

使用 Newey-West 调整后，“预期差”选股的超额收益（α）的 t-statistic 从 3.325 上升至 4.371；HML 以及 MOM 因子的系数 β_HML 和 β_MOM 的 t-statistics 分别从 20.171 和 3.420 降低到 10.778 和 2.233。

5、简化版 Newey-West 调整

上一节说明了在进行时序回归的 portfolio test 中如何进行 Newey-West 调整。那么，使用截面回归的 regression test 又如何呢？

在因子分析中，Fama-MacBeth regression 是最常见的截面回归方法（Fama and MacBeth 1973）。在该回归中，每一期使用当期因子暴露和个股下一期的收益率进行截面回归，得到因子的收益率；在全部期进行截面回归后，便可得到每个因子收益率的时间序列。将因子收益率在时序上取均值就得到每个因子的预期收益率，而我们关心的是该因子预期收益率是否显著不为零。

对于任何因子，其收益率序列在时序上很可能存在异方差和自相关性，因此在计算其均值标准误的时候需要进行 Newey-West 调整。然而，这和上面的多因子时序回归很不相同。如何进行 Newey-West 调整呢？

关于这个问题，Turan Bali、Robert Engle、Scott Murray 三位所著的经典教材 Empirical Asset Pricing, the cross section of stock returns（Bali et al. 2016）给出了答案。对于单个因子的收益率序列，将其用 1 作为 regressor 回归得到残差 —— 这相当于用因子收益率减去它在时序上的均值。然后把这个残差和 X = 1 代入到 Newey-West 调整中即可。

在这个简化版的 Newey-West 调整中，Q 的估计 S 简化为：

其中 f_t 代表被检验因子的收益率时间序列，E_t[f_t] 是它在时序上的均值。由于我们仅仅有一个 regressor，因此上述 S 其实是一个标量。将它代入到 V_OLS 的表达式中，在对其开方，就得到 E_t[f_t] 的标准误：

对每个因子依次使用上述修正，获得其各自收益率均值的 standard error，然后就可以计算 t-statistic 以及 p-value 并检验它们的显著性。

6、结语

本文介绍了计量经济学中常见的 Newey-West 估计（顺便提一句， White 1980 估计也十分流行），它们在因子回归分析中无处不在。在 portfolio test 中，通过时序回归，并应用 Newey-West 调整对多个 regressors 的回归系数的标准误同时修正；在 regression test 中，首先通过 T 期截面回归得到因子的收益率时序，然后再对该时序进行 Newey-West 调整从而得到因子预期收益率的标准误。

在 Barra 的因子模型中，采用 Newey-West 调整对日频因子收益率的协方差矩阵进行了修正（Briner et al. 2009, pp 25）：

有必要指出的是，Barra 修正的是因子收益率的协方差矩阵，而不是因子收益率均值或者任何回归系数 β 的协方差矩阵。仔细检查上面的式子，并没有看到任何 regressor 矩阵 X 或者残差向量 e 的身影；以上 Barra 的用法和本文讨论的 portfolio test 和 regression test 中的 Newey-West 调整都不太一样。我对其的理解是（欢迎批评、指正），Barra 借鉴了 Newey-West 在处理 middle matrix Q时引入滞后期处理自相关性的方法，将它的日频自相关矩阵 C 对标为 Newey and West (1987) 中的 \hat Ω_0，从而应用了 Newey and West (1987) 中的式 (5)。

最后，非常感谢你认真看到这里。这不是一篇 fancy 的文章，而是一篇工具文，希望它能对你有些帮助。在我自己进行 empirical asset pricing 研究时，在 portfolio test 和 regression test 时也会用到 Newey-West 调整。相信你看完本文，在今后再看到我提及它的时候，知道我干了什么。

参考文献

Bali, T. G., R. F. Engle, and S. Murray (2016). Empirical asset pricing, the cross section of stock returns. John Wiley & Sons, Inc., Hoboken, New Jersey.

Briner, B. G., R. C. Smith, and P. Ward (2009). The Barra Europe equity model (EUE3). Research Notes.

Carhart, M. M. (1997). On Persistence in Mutual Fund Performance.Journal of Finance, Vol. 52(1), 57 – 82.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds.Journal of Financial Economics, Vol. 33(1), 3 – 56.

Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.

Greene, W. H. (2003). Econometric Analysis (5th ed). Prentice Hall, Upper Saddle River, New Jersey.

Newey, W. K. and K. D. West (1987). A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix.Econometrica, Vol. 55(3), 703 – 708.

Newey, W. K. and K. D. West (1994). Automatic lag selection in covariance matrix estimation. Review of Economic Studies, Vol. 61(4), 631 – 653.

White, H. (1980). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica, Vol. 48(4), 817 – 838.

来源：；量信投资作者：石川博士已获得授权

---------------------------------------------------------------------------------------------

拓展阅读：