Tensflow预测股票实例

2022-12-02 21:44:18
import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import tensorflow as tf

#——————————————————导入数据——————————————————————

f=open('./dataset/dataset_1.csv')

df=pd.read_csv(f)     #读入股票数据

data=np.array(df['最高价'])   #获取最高价序列

data=data[::-1]      #反转，使数据按照日期先后顺序排列

#以折线图展示data

# plt.figure()

# plt.plot(data)

# plt.show()

normalize_data=(data-np.mean(data))/np.std(data)  #标准化

normalize_data=normalize_data[:,np.newaxis]       #增加维度

#生成训练集

#设置常量

time_step=20      #时间步

rnn_unit=10       #hidden layer units

batch_size=60     #每一批次训练多少个样例

input_size=1      #输入层维度

output_size=1     #输出层维度

lr=0.0006         #学习率

train_x,train_y=[],[]   #训练集

for i in range(len(normalize_data)-time_step-1):

    x=normalize_data[i:i+time_step]

    y=normalize_data[i+1:i+time_step+1]

    train_x.append(x.tolist())

    train_y.append(y.tolist()) 

#——————————————————定义神经网络变量——————————————————

X=tf.placeholder(tf.float32, [None,time_step,input_size])    #每批次输入网络的tensor

Y=tf.placeholder(tf.float32, [None,time_step,output_size])   #每批次tensor对应的标签

#输入层、输出层权重、偏置

weights={

         'in':tf.Variable(tf.random_normal([input_size,rnn_unit])),

         'out':tf.Variable(tf.random_normal([rnn_unit,1]))

         }

biases={

        'in':tf.Variable(tf.constant(0.1,shape=[rnn_unit,])),

        'out':tf.Variable(tf.constant(0.1,shape=[1,]))

        }

#——————————————————定义神经网络变量——————————————————

def lstm(batch):      #参数：输入网络批次数目

    w_in=weights['in']

    b_in=biases['in']

    input=tf.reshape(X,[-1,input_size])  #需要将tensor转成2维进行计算，计算后的结果作为隐藏层的输入

    input_rnn=tf.matmul(input,w_in)+b_in

    input_rnn=tf.reshape(input_rnn,[-1,time_step,rnn_unit])  #将tensor转成3维，作为lstm cell的输入

    cell=tf.nn.rnn_cell.BasicLSTMCell(rnn_unit)

    init_state=cell.zero_state(batch,dtype=tf.float32)

    output_rnn,final_states=tf.nn.dynamic_rnn(cell, input_rnn,initial_state=init_state, dtype=tf.float32)  #output_rnn是记录lstm每个输出节点的结果，final_states是最后一个cell的结果

    output=tf.reshape(output_rnn,[-1,rnn_unit]) #作为输出层的输入

    w_out=weights['out']

    b_out=biases['out']

    pred=tf.matmul(output,w_out)+b_out

    return pred,final_states

#——————————————————训练模型——————————————————

def train_lstm():

    global batch_size

    pred,_=lstm(batch_size)

    #损失函数

    loss=tf.reduce_mean(tf.square(tf.reshape(pred,[-1])-tf.reshape(Y, [-1])))

    train_op=tf.train.AdamOptimizer(lr).minimize(loss)

    saver=tf.train.Saver(tf.global_variables())

    with tf.Session() as sess:

        sess.run(tf.global_variables_initializer())

        #重复训练10000次

        for i in range(10000):

            step=0

            start=0

            end=start+batch_size

            while(end<len(train_x)):

                _,loss_=sess.run([train_op,loss],feed_dict={X:train_x[start:end],Y:train_y[start:end]})

                start+=batch_size

                end=start+batch_size

                #每10步保存一次参数

                if step%10==0:

                    print(i,step,loss_)

                    print("保存模型：",saver.save(sess,'./module2/stock.model'))

                step+=1

#————————————————预测模型————————————————————

def prediction():

    pred,_=lstm(1)      #预测时只输入[1,time_step,input_size]的测试数据

    saver=tf.train.Saver(tf.global_variables())

    with tf.Session() as sess:

        #参数恢复

        module_file = tf.train.latest_checkpoint('./module2/')

        saver.restore(sess, module_file) 

        #取训练集最后一行为测试样本。shape=[1,time_step,input_size]

        prev_seq=train_x[-1]

        predict=[]

        #得到之后100个预测结果

        for i in range(100):

            next_seq=sess.run(pred,feed_dict={X:[prev_seq]})

            predict.append(next_seq[-1])

            #每次得到最后一个时间步的预测结果，与之前的数据加在一起，形成新的测试样本

            prev_seq=np.vstack((prev_seq[1:],next_seq[-1]))

        #以折线图表示结果

        plt.figure()

        plt.plot(list(range(len(normalize_data))), normalize_data, color='b')

        plt.plot(list(range(len(normalize_data), len(normalize_data) + len(predict))), predict, color='r')

        plt.show()

if __name__ == '__main__':

    # train_lstm()

    prediction()

    hello = tf.constant('Hello, TensorFlow!')

    sess = tf.Session()

    print(sess.run(hello))
数据集格式：
时间最高价
2015/12/11 3455.55
2015/12/10 3503.65
2015/12/9 3495.7
2015/12/8 3518.65
2015/12/7 3543.95
2015/12/4 3568.97
2015/12/3 3591.73
2015/12/2 3538.85
2015/12/1 3483.41
2015/11/30 3470.37
2015/11/27 3621.9
2015/11/26 3668.38
2015/11/25 3648.37
2015/11/24 3616.48
2015/11/23 3654.75
2015/11/20 3640.53
2015/11/19 3618.21
2015/11/18 3617.07
2015/11/17 3678.27
码农公寓

相关文章