600字范文 > 【深度学习】循环神经网络（RNN）的tensorflow实现

【深度学习】循环神经网络（RNN）的tensorflow实现

时间：2022-09-17 04:13:17

一、循环神经网络原理1.1、RNN的网络结构1.2、RNN的特点1.3、RNN的训练二、循环神经网络的tensorflow实现参考资料

循环神经网络又被成为时间递归神经网络（Recurrent Neural Networks），传统神经网络，每一个时间步隐含层神经元之间没有连接。但RNN中每一个时间步的隐含层输入由当前时间步的输入和上一时间步的隐含层输出共同决定，因此历史数据的影响不会消失，而是会继续存活。

一、循环神经网络原理

1.1、RNN的网络结构

RNN网络结构如下图所示

每一个RNN cell都包括输入部分，隐含层部分和输出部分。RNN cell的数量等于时间步数量，前一个RNN cell的隐含层部分连接到下一个RNN cell的隐含层。RNN cell的输出连接到CTC层，然后输出预测数据。

每一时间步的RNN cell的具体结构图如下所示：

如图所示，第ttt时间步对应的RNN cell的网络结构。

输入层：输入层节点数为输入样本特征维度。输入为Xt={xt1,xt2,⋯ ,xtn}{X_t} = \left\{ {x_t^1,x_t^2, \cdots ,x_t^n} \right\}Xt={xt1,xt2,⋯,xtn}，就是说输入层节点数为nnn。

隐含层：隐含层节点数可以自己设定，上图中隐含层节点数为nnn。隐含层输入数据为：

St=Xt⋅U+St−1⋅W{S_t} = {X_t} \cdot U + {S_{t - 1}} \cdot WSt=Xt⋅U+St−1⋅W

输出层：上图中输出层节点数为rrr，输出层输入为:

Ot=St⋅V{O_t} = {S_t} \cdot VOt=St⋅V

WWW为连接相邻时间步隐含层的权重矩阵，维度为m×mm×mm×m；UUU为连接输入层与隐含层的权重矩阵，维度为n×mn×mn×m；VVV为连接隐含层到输出层的权重矩阵，维度为m×rm×rm×r。

1.2、RNN的特点

（1）、不像传统的深度神经网络，在不同的层使用不同的参数，循环神经网络在所有步骤中共享参数（U、V、W）。这个反映一个事实，我们在每一步上执行相同的任务，仅仅是输入不同。这个机制极大减少了我们需要学习的参数的数量（参考资料【1】）。

（2）、RNN每一步都有输出，但是根据任务的不同，这个并不是必须的。任务的需要，可以通过调整RNN的输出与CTC层之间的连接实现。

1.3、RNN的训练

循环神经网络的训练类似于传统神经网络的训练，也使用反向传播算法。因为循环神经网络在所有时刻的参数是共享的，但是每个输出的梯度不仅依赖当前时刻的计算，还依赖之前时刻的计算，所以RNN的训练采用BPTT（Backpropagation Through Time）方法（参考资料【1,2】）。

二、循环神经网络的tensorflow实现

本博文使用tensorflow实现RNN对sine函数的回归。

python代码地址：/shiluqiang/RNN_regression

import numpy as npimport tensorflow as tfimport randomtf.reset_default_graph() ##用于清除默认图形堆栈并重置全局默认图形def build_data(feature_len): #构造2000个序列长度为n的正弦序列，前1500个作为训练集，后500个作为测试集xs=[]ys=[]for i in range(2000):k=random.uniform(1,50)x=[[np.sin(k + j)] for j in range(0,feature_len)]y=[np.sin(k + feature_len)]xs.append(x)ys.append(y)train_x=np.array(xs[0:1500])train_y=np.array(ys[0:1500])test_x=np.array(xs[1500:])test_y=np.array(ys[1500:])return train_x,train_y,test_x,test_yclass RNN_Sine():'''定义RNN_Sine类'''def __init__(self,n_steps,n_inputs,batch_size,hidden_size,input_train_feature,input_train_label,input_test_feature,input_test_label,n_output):self.batch_size = batch_size # RNN模型中RNNcell的个数self.hidden_size = hidden_size # RNN cell 隐含层节点数self.n_steps = n_steps #RNN每个节点输入特征的长度self.n_inputs = n_inputs #特征中每个元素的长度self.input_train_feature = input_train_feature #数据特征self.input_train_label = input_train_label #数据标签self.input_test_feature = input_test_featureself.input_test_label = input_test_labelself.n_output = n_output #CTC层输出节点数def seq_predict_model(self,X,W,b):## 初始化RNN单元X = tf.transpose(X,[1,0,2]) ##交换batch_size和n_stepsX = tf.reshape(X,[-1,self.n_inputs]) ##(n_steps*batch_size,n_inputs) X = tf.split(X,self.n_steps,0) ## n_steps * (batch_size, n_inputs)rnn_cell = tf.contrib.rnn.BasicRNNCell(num_units = self.batch_size)init_state = rnn_cell.zero_state(self.batch_size,dtype = tf.float32)outputs,states = tf.contrib.rnn.static_rnn(rnn_cell,X,initial_state = init_state) ## outputs -- [n_steps,batch_size,hidden_size]y_pred = tf.matmul(outputs[-1],W) + breturn y_preddef fit(self):'''RNN模型训练'''#1.声明输入输出的占位符X = tf.placeholder('float',[None,self.n_steps,self.n_inputs],name = 'X')Y = tf.placeholder('float',[None,self.n_output],name = 'Y')# 2.输出层参数W = tf.Variable(tf.random_normal([self.hidden_size,self.n_output]))b = tf.Variable(tf.random_normal([self.n_output]))# 3.构造RNN计算图y_pred = self.seq_predict_model(X,W,b)# 4.声明代价函数和优化算法loss = tf.sqrt(tf.square(tf.subtract(Y,y_pred)))train_op = tf.train.GradientDescentOptimizer(0.001).minimize(loss)# 5.构造迭代过程并预测结果trX = self.input_train_featuretrY = self.input_train_labelteX = self.input_test_featureteY = self.input_test_labelwith tf.Session() as sess:tf.initialize_all_variables().run()for i in range(50):for end in range(batch_size,len(trX),batch_size):begin = end - batch_sizex_value = trX[begin:end]y_value = trY[begin:end]#通过session.run接口触发执行sess.run(train_op,feed_dict={X:x_value,Y:y_value})test_indices=np.arange(len(teX)) #在训练的过程中开始测试np.random.shuffle(test_indices)test_indices=test_indices[0:self.batch_size]x_value=teX[test_indices]y_value=teY[test_indices]val_loss=np.mean(sess.run(loss,feed_dict={X:x_value,Y:y_value})) #使用均方差作为代价函数print ('Run %s'%i,val_loss)if __name__ == '__main__':print('--------------------1. Parameters Setting--------------------')n_steps = 10 ##每个RNN cell输入特征长度n_inputs = 1 ##特征中每个元素的大小batch_size = 10 ##rnn网络的节点数hidden_size = 10 ##RNN cell中隐含层节点数n_output = 1 print('-----------------------2. Load Data---------------------------')input_train_feature,input_train_label,input_test_feature,input_test_label = build_data(n_steps)print('-------------------3.Model Training------------------')rnn = RNN_Sine(n_steps,n_inputs,batch_size,hidden_size,input_train_feature,input_train_label,input_test_feature,input_test_label,n_output)rnn.fit()

参考资料

1、/gzj_1101/article/details/79189286

2、/zhaojc1995/article/details/80572098

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。