不同频率数据的处理方法
降频
- 这个方法不行,因为我们要做到daily based predict,而我们能拿到的高频的数据就是daily,如果我们能拿到更高配的数据那也行
最简单(扭曲了现象)
- 直接把这个季度里面的所有天的数据都放成一个值
- 高频数据:天
- 低频数据:季度
插值(扭曲)
- 低频模型给出估计以后线性插值做为高频因子
- 50个数字丢了一个是可以插值,少量的数据丢了可以
dummy variable的方法(这个方法比较practical)
- GDP 公布的时候他的值是1,其他的时候标注为0
- 公布的时候可能之前多
- GDP的之后
在低频数据结果的时候把其对于下一天数据的影响变高(和dummy variable一样的)
- 就相当于在正常的时候还是日度指标rank高一些,等月(季)度数据出来的时候这个月(季)度数据指标rank高一些