Face Recognition Loss on Mnist with Pytorch

06-10

寫在前面

這篇文章的重點不在於講解FR的各種Loss，因為知乎上已經有很多，搜一下就好，本文主要提供了各種Loss的Pytorch實現以及Mnist的可視化實驗，一方面讓大家藉助代碼更深刻地理解Loss的設計，另一方面直觀的比較各種Loss的有效性，是否漲點並不是我關注的重點，因為這些Loss的設計理念之一就是增大收斂難度，所以在Mnist這樣的簡單任務上訓練同樣的epoch，先進的Loss並不一定能帶來點數的提升，但從視覺效果可以明顯的看出特徵的分離程度，而且從另一方面來說，分類正確不代表一定能能在用歐式/餘弦距離做1:1驗證的時候也正確...

本文主要仿照CenterLoss文中的實驗結構，使用了一個相對複雜一些的LeNet升級版網路，把輸入圖片Embedding成2維特徵向量以便於可視化。

對了，代碼里用到了TensorBoardX來可視化，當然如果你沒裝，可以注釋掉相關代碼，我也寫了本地保存圖片，雖然很不喜歡TensorFlow，但TensorBoard還是真香，比Visdom強太多了...

早就想寫這篇文章了，趁著五一假期終於...

具體代碼在Github：https://github.com/MccreeZhao/FR-Loss-on-Mnist/blob/master/README.md 有興趣的話點個Star呀~雖然剛起步還沒什麼東西

文章里只展示loss寫法

Softmax

公式推導

$L_1 = -frac{1}{m}sum_{i=1}^{m}logfrac{e^{W_{yi}^T x_i+b_{y_i}}} {sum_{j=1}^n e^{W_j^Tx_i + b_j} } = -frac{1}{m}sum_{i=1}^{m}logfrac{e^{||W_{yi}||cdot|| x_i||cos( heta_{y_i})+b_{y_i}}} {sum_{j=1}^n e^{||W_j||cdot||x_i||cos( heta_{j}) + b_j} }$

Pytorch代碼實現

class Linear(nn.Module): def __init__(self): super(Linear, self).__init__() self.weight = nn.Parameter(torch.Tensor(2,10))#(input,output) self.bias = nn.Parameter(torch.Tensor(1,10)) nn.init.xavier_uniform_(self.weight)

def forward(self, x): out = x.mm(self.weight)+self.bias return out criterion = nn.CrossEntropyLoss() loss = criterion(out,label) #CrossEntropyLoss等同於nn.LogSoftmax()+nn.NLLLoss()