往期精彩内容:
时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较
全是干货 | 数据集、学习资料、建模资源分享!
EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(一)EMD-****博客
EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(二)EEMD
EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(三)FEEMD-****博客
EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现(四)CEEMD-****博客
EMD变体分解效果最好算法——CEEMDAN(五)-****博客
拒绝信息泄露!VMD滚动分解 + Informer-BiLSTM并行预测模型-****博客
风速预测(一)数据集介绍和预处理_风速数据在哪里下载-****博客
风速预测(二)基于Pytorch的EMD-LSTM模型-****博客
风速预测(三)EMD-LSTM-Attention模型-****博客
风速预测(四)基于Pytorch的EMD-Transformer模型-****博客
风速预测(五)基于Pytorch的EMD-CNN-LSTM模型-****博客
风速预测(六)基于Pytorch的EMD-CNN-GRU并行模型-****博客
单步预测-风速预测模型代码全家桶-****博客
CEEMDAN +组合预测模型(BiLSTM-Attention + ARIMA)-****博客
CEEMDAN +组合预测模型(Transformer - BiLSTM + ARIMA)-****博客
CEEMDAN +组合预测模型(CNN-LSTM + ARIMA)-****博客
前言
本文基于前期介绍的风速数据(文末附数据集),介绍一种多特征变量序列预测模型CNN-LSTM,以提高时间序列数据的预测性能。该数据集一共有天气、温度、湿度、气压、风速等九个变量,通过滑动窗口制作数据集,利用多变量来预测风速。
LSTF(Long Sequence Time-Series Forecasting)问题是指在时间序列预测中需要处理长序列的情况。在实际应用中,时间序列可能会包含非常大量的数据点,在这种情况下,传统的时间序列预测模型可能会遇到一些挑战,因为处理长序列时会出现一些问题,例如:
-
长期依赖性: 随着时间序列数据的增长,模型需要能够捕捉长期的依赖关系和趋势。
-
计算复杂性: 针对长序列进行训练和预测通常需要更多的计算资源和时间。
-
内存消耗: 长序列通常需要大量的内存来存储数据和模型参数,这可能会导致内存耗尽或者性能下降的问题。
在处理LSTF问题时,选择合适的窗口大小(window size)是非常关键的。选择合适的窗口大小可以帮助模型更好地捕捉时间序列中的模式和特征,为了提取序列中更长的依赖建模,本文把窗口大小提升到96,运用CNN-LSTM模型来充分提取序列中的特征信息。
风速数据集的详细介绍可以参考下文:
风速预测(一)数据集介绍和预处理_垂直风速气象数据源-****博客
1 多特征变量数据集制作与预处理
1.1 导入数据
1.2 数据集制作与预处理
先划分数据集,按照9:1划分训练集和测试集
制作数据集
2 基于Pytorch的CNN-LSTM 预测模型
2.1 定义CNN-LSTM预测模型
注意:输入风速数据形状为 [256, 96, 8], batch_size=256,96代表序列长度(滑动窗口取值), 维度8维代表挑选的8个变量。
2.2 设置参数,训练模型
50个epoch,MSE 为0.00082814,多变量特征CNN-LSTM预测效果良好,适当调整模型参数,还可以进一步提高模型预测表现。
注意调整参数:
-
可以适当增加CNN层数和隐藏层的维度,微调学习率;
-
调整LSTM层数和维度数,增加更多的 epoch (注意防止过拟合)
-
可以改变滑动窗口长度(设置合适的窗口长度)
3 模型评估与可视化
3.1 结果可视化
3.2 模型评估