【机器学习与数据挖掘】统计回归模型(Market intraday momentum)

最近读了Market intraday momentum(市场日内动量)
对其中使用的统计回归方法做记录

(1)什么是统计回归模型?

回归模型(regression model)对统计关系进行定量描述的一种数学模型。
如多元线性回归的数学模型可以表示为
【机器学习与数据挖掘】统计回归模型(Market intraday momentum)
β0,β1,…,βn是n+1个待估计的参数,
εi是相互独立且服从同一正态分布N(0,σ2)的随机变量
y是随机变量
x是随机变量或非随机变量
βi称为回归系数,描述自变量对因变量影响的程度。

(2)统计回归模型定义

回归模型是一种预测性的建模技术,通常用于预测分析
它研究的是因变量(目标)和自变量(预测器即predictor)之间的关系。

(3)文中应用

在Market intraday momentum文章中,分别使用了1元线性回归(r1)和2元线性回归(r1和r12)两种方法:
使用r1和r12作为预测器对S&P500指数进行预测
并在样本外(OS:out of sample)计算了R-square来对两种方法进行评估,得到R-square=1.6%,据说很好(R-square是什么?
原文:
The predictive R2 of the first half hour return on the last half hour return is 1.6%, a level that matches or exceeds typical predictive R2s at the monthly frequency (see, e.g., Rapach and Zhou, 2013)
前半小时收益率的预测R2为最后一个半小时收益率的1.6%,该水平以每月频率等于或超过典型的预测R2(参见Forecasting Stock Returns,Handbook of Economic Forecasting,2013

原文:
The first half-hour return, r1, positively predicts the last half-hour return, r13, with a slope of 6.94 (scaled by 100), statistically significant at the 1% level, and an R2 of 1.6%. Such a high predictive R2 is impressive, as almost all typical predictors have lower R2s (see, e.g., Rapach and Zhou, 2013).
前半小时收益率r1可以肯定地预测最后半小时收益率r13,其斜率为6.94(按100缩放),在1%的水平上具有统计显着性,而R2为1.6%。 如此高的预测R2令人印象深刻,因为几乎所有典型的预测指标都具有较低的R2(参见Forecasting Stock Returns,Handbook of Economic Forecasting,2013)。

为何选取r1和r12?
据国信证券的研报A股日内动量效应(一):半小时涨跌幅之间的规律显示(PS:这个链接的图有问题,主要看思路)
我们通过验证得出(正/负)相关性较强的预测器为A股的11:00-11:30和9:00-9:30这两个时间段,所以选择这两个作为预测器(predictor)

(4)模型建立和检验

建立

  1. 选取一元线性回归模型的变量
  2. 绘制计算表和拟合散点图
  3. 计算变量间的回归系数及其相关的显著性
  4. 回归分析结果的应用

检验

  1. 经济意义检验:根据模型中参数的经济含义,分析各参数的值是否与分析对象的经济含义相符
  2. 回归标准差检验
  3. 拟合优度检验
  4. 回归系数的显著性检验

说明
市场现象一般是受多种因素的影响,故应用一元线性回归分析预测法适用于存在一个对因变量影响作用明显高于其他因素的变量的情况。

上一篇:python学习笔记(一)matplotlib、numpy、Pandas


下一篇:Android Studio目录的理解