RNN（循环神经网络）|Candy的小破站

时序预测任务：当前的输出与前面的输出也有关，即x_t = f(x_t-1, x_t-2......x_t-n)，f 即时序神经网络

传统RNN：n个输入n个输出、n个输入1个输出

以n个输入，1个输出为例，上图是一个经典的 RNN 神经网络架构，输入（x₁,x₂,x₃,x₄）输出一个预测值y

具体而言，利用公式 h_t = f(U * x_t + W * h_t-1 + b) 从 h₁ 开始迭代计算出 h₄，再通过 y = g(V * h₄ + c)计算出最终结果 y，其中 U,W,b,V,c 是神经网络训练学习出的参数，让损失函数尽量小的参数，g 是激活函数，如图中的Softmax

初始化h₀，输入x₁，得到h₁
利用h₁，输入x₂，得到h₂
利用h₂，输入x₃，得到h₃
利用h₃，输入x₄，得到h₄
利用h₄，输出最终的y值

RNN变体：n个输入，m个输出

如上图所示，采用经典的 Encoder-Decoder 结构，即拥有两个 RNN 网络，一个叫Encoder，一个叫Decoder，将（x₁,x₂,x₃,x₄）编码为（h₁,h₂,h₃,h₄） ，再由编码后的（h₁,h₂,h₃,h₄）计算出c，c 可以有多种方式计算，如图中的(1)、(2)、(3)均可，作为 Decoder 网络的输入，然后Decoder 网络再进行预测