RNN part 5-GRU(Gated Recurrent Unit)
05-08
GRU(Gated Recurrent Unit)由Cho, et al在2014年提出。是LSTM模型的變種,進行了適當的簡化。
1. GRU

結構如圖所示,其中
表示
時刻的hidden state
表示 candidate
表示update gate,用來控制如何對隱藏狀態
進行更新
表示reset date,用來控制產生
這個模型較為簡單,數據流圖也不做過多解讀。
2. GRU與LSTM的比較
與LSTM相比,GRU存在著下述特點。
- 門數不同。GRU只有兩個門
- reset gate
和
- update gate
。
- 在GRU中,
和
共同控制了如何從之前的隱藏狀態
計算獲得新的隱藏狀態
,而取消了LSTM中的output gate。
- 如果reset gate為1,而update gate為0的話,則GRU完全退化為一個傳統RNN。
在實踐中,一般認為LSTM和GRU之間並沒有明顯的優勝者。因為GRU具有較少的參數,所以訓練速度快,而且所需要的樣本也比較少。而LSTM具有較多的參數,比較適合具有大量樣本的情況,可能會獲得較優的模型。
在Andrew的課程中表示,如果只能選擇一個模型,那麼LSTM是大家的default RNN。
推薦閱讀:
※循環神經網路(RNN)介紹3:RNN的反向傳播演算法Backpropagation Through Time (BPTT)
※這 8 份「Paper + Code」,你一定用得上 | PaperDaily #08
※論文分享-語言模型-1-Breaking the Softmax Bottleneck:A High-Rank RNN Language Model
※使用RNN預測股票價格系列二
