期货大数据:从商品间相关系数挖掘市场宏观性趋势

相关系数( Correlation coefficient)

相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。


相关系数 r的值介于–1 与+1之间,在二维线形条件下,当 r为1 时,表示两组变量为完全的正相关;r为-1时则表示完全负相关;r越靠近0轴,两组变量间相关性越弱。一般来说,|r|在0.7以上已属高度相关。


各品种间相关性数据分析图

从和讯金融实验室最近给出的一张25个主连品种间相关性数据分析图(图1)上,我们发现了一些较为显著的规律和信息。该图统计了从2010年至今,时间框架为30日的25*24个相关系数矩阵的连续线图。在每个交易日上,程序计算了将近600数据点。

期货大数据:从商品间相关系数挖掘市场宏观性趋势
图1 25个品种间相关性数据分析图 - 历史概览 资料来源:和讯金融实验室


相关系数的规律性表现

影响商品间相关性的因素分为内生性因素和外部环境因素。其中内生性因素又包括属性因素和成本链因素。


一般情况下,除互补商品和互为替代品之间应该呈现强烈的正相关和强烈的负相关关系以外,其他品种间并没有属性上的内生性关联。叠加了大宗商品的成本链传导关系,大宗商品间应该普遍存在的是较弱的正相关关系。


反映在数据上,我们可以找到诸如铁矿石、焦煤、焦炭、螺纹钢的这一条正相关成本链。然而由宏观环境因素引起的大型趋势会加强这条链路的传导,使得大宗商品间形成极强的正相关。


随着宏观环境引起的趋势行情的结束,各品种先后错位的回落让相关系数在数值上变现为短暂的由正转负。因此在以30天为时间框架下的相关系数线图上,我们能找到印证这些规律的证据。


我们截取几个片段作为举例参考,如图2:

期货大数据:从商品间相关系数挖掘市场宏观性趋势
图2 25个品种间相关性数据分析图 - 2010.1~2011.9 资料来源:和讯金融实验室


相关性规律对于对冲交易的指导意义

在图2中我们可以看到,在趋势较为强烈的情况下,各商品期货品种间表现出相当高的正相关性,在一轮趋势的中间区域,大宗商品间相关系数趋近于1。这反过来证明了当时的趋势是强烈的。


在这段时间内,做对冲交易实际上意义不大,不如将大部分资金投入单边交易以获取利润的最大化。


而当宏观政策等影响因素被市场消化后,商品间相关性趋于分化,回归了正常状态,而单边有序且强烈的普遍正相关现象出现的频率有所降低,商品整体并没有强烈的单边趋势性行情。此时则应以对冲交易或套利交易为主。


在此后的2012年和2013年上半年,我们找到了弱化了的趋势,如图3:

期货大数据:从商品间相关系数挖掘市场宏观性趋势
图3 25个品种间相关性数据分析图 - 2012.06~2013.08 资料来源:和讯金融实验室


期货市场相关性(趋势性)明显减弱

从去年10月份以来,随着数个新品种的上市推出,我们可以明显地感觉到各品种间的相关性规律正在减弱。从去年国庆至今没有出现过一次宏观性的趋势行情,表现在相关性数据序列上,从去年10月份以来整体都处于无序杂乱的状态。对于趋势性系统来说,这段时间确实是较为困难的时段。事实上,在这种市场环境下,投资者应该配置绝大部分资金在对冲交易或套利交易上等待机会。如果这种市场状态维持到今年年底,我们应该可以看到对冲基金今年的业绩表现会远远好于单边投机的配置基金业绩。

  见图4:

期货大数据:从商品间相关系数挖掘市场宏观性趋势


原文发布时间为:2014-07-13

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

上一篇:MAC OSX使用Python安装模块问题


下一篇:SOFAMesh中的多协议通用解决方案x-protocol介绍系列(1) : DNS通用寻址方案