Person Re-Identification:論文筆記3
Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Baseline)
1. 習得具有識別力的部分特徵的前提是各部分準確地對齊。現有的關於對齊的技術分為兩派:一種使用外部的線索對姿態進行評估,過程中利用了外部的數據集,另一種是對圖像進行語義分割,但是這兩種方法均有缺陷——第一種引用外部數據集時數據集的偏差將使姿態估計不準確,第二種圖像語義分割易受雜訊點的干擾。
2. 本文提出一種網路Part-based Convolutional Baseline,簡稱PCB,和一種適應性的池化方法用來對PCB進行細化和改進,即Refined Part Pooling,簡稱RRP。以下分別介紹PCB和RRP。
3. PCB的網路結構如下

從input image到tensor T的部分使用的是現有網路的一部分,譬如本文中使用的是Resnet50,將Resnet50 中的GAP及之後的層捨去,就是input image到tensor T的這部分。
之後average pooling得到column vectors g ,在進行1x1的卷積降維,得到column vectors h ,論文里將h限定為256維,最後利用全連接層得到ID predictions。
需要說明的是,從tensor T 到 column vectors g ,先均勻劃分T,再分別對每一個均勻部分進行average,從而得到的column vectors g
4. 由於PCB的均勻劃分T導致有些均勻部分中出現了離群點(outfilters),RRP正是用於對這些離群點進行重新定位,以使各部分具有內部一致性。RRP具體細節如下:

離群點的判定是通過餘弦距離得到,譬如對於某一tensor T 中的 column vector f,計算f 與 gi(i=1,2……p,i代表第i個column vector g),距離最小即認為f與gi最接近,如f為均勻部分1中的column vector,但與g2距離最接近,則認為f是部分1中的一個離群點。
對離群點進行重定位:
1) 計算f屬於部分Pi的可能性P(Pi|f),公式如下:

2) 計算細化後的各部分Pi,公式如下:

RRP演算法結束。
5. 加入RRP之後的PCB網路如下:

具體演算法如下:
步驟1。將標準PCB訓練成具有均勻劃分的部分直至收斂性。
步驟2。在tensor T上附加了一個p類部分分類器。
步驟3。所有預先訓練好的PCB層都是固定的。只有p類分類器是可訓練的。該模型經過訓練,直到再次收斂。
步驟4。整個網路都經過了微調,以實現全局優化的收斂。
以上就是完整的PCB+RRP演算法。
6. 總結:本文提出了兩種方法來解決ReID問題,PCB用於通過簡單的均勻劃分策略集合了部分特徵,使現有技術達到了一個新的水平,簡單有效。RRP方法改進了PCB網路結構,增強了各部分內部的一致性。
推薦閱讀:
※elasticsearch安裝筆記
※讀思筆記143:讀巫鴻《武梁祠》隨筆
※雅思寫作筆記——(二)prediction題型 例1-2
※每日筆記8-13
※PDMA新產品開發手冊【筆記】(一)
