Person Re-Identification:論文筆記3

Person Re-Identification:論文筆記3

Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Baseline)

1. 習得具有識別力的部分特徵的前提是各部分準確地對齊。現有的關於對齊的技術分為兩派:一種使用外部的線索對姿態進行評估,過程中利用了外部的數據集,另一種是對圖像進行語義分割,但是這兩種方法均有缺陷——第一種引用外部數據集時數據集的偏差將使姿態估計不準確,第二種圖像語義分割易受雜訊點的干擾。

2. 本文提出一種網路Part-based Convolutional Baseline,簡稱PCB,和一種適應性的池化方法用來對PCB進行細化和改進,即Refined Part Pooling,簡稱RRP。以下分別介紹PCB和RRP。

3. PCB的網路結構如下

從input image到tensor T的部分使用的是現有網路的一部分,譬如本文中使用的是Resnet50,將Resnet50 中的GAP及之後的層捨去,就是input image到tensor T的這部分。

之後average pooling得到column vectors g ,在進行1x1的卷積降維,得到column vectors h ,論文里將h限定為256維,最後利用全連接層得到ID predictions。

需要說明的是,從tensor T 到 column vectors g ,先均勻劃分T,再分別對每一個均勻部分進行average,從而得到的column vectors g

4. 由於PCB的均勻劃分T導致有些均勻部分中出現了離群點(outfilters),RRP正是用於對這些離群點進行重新定位,以使各部分具有內部一致性。RRP具體細節如下:

離群點的判定是通過餘弦距離得到,譬如對於某一tensor T 中的 column vector f,計算f 與 gi(i=1,2……p,i代表第i個column vector g),距離最小即認為f與gi最接近,如f為均勻部分1中的column vector,但與g2距離最接近,則認為f是部分1中的一個離群點。

對離群點進行重定位:

1) 計算f屬於部分Pi的可能性P(Pi|f),公式如下:

2) 計算細化後的各部分Pi,公式如下:

RRP演算法結束。

5. 加入RRP之後的PCB網路如下:

具體演算法如下:

步驟1。將標準PCB訓練成具有均勻劃分的部分直至收斂性。

步驟2。在tensor T上附加了一個p類部分分類器。

步驟3。所有預先訓練好的PCB層都是固定的。只有p類分類器是可訓練的。該模型經過訓練,直到再次收斂。

步驟4。整個網路都經過了微調,以實現全局優化的收斂。

以上就是完整的PCB+RRP演算法。

6. 總結:本文提出了兩種方法來解決ReID問題,PCB用於通過簡單的均勻劃分策略集合了部分特徵,使現有技術達到了一個新的水平,簡單有效。RRP方法改進了PCB網路結構,增強了各部分內部的一致性。


推薦閱讀:

elasticsearch安裝筆記
讀思筆記143:讀巫鴻《武梁祠》隨筆
雅思寫作筆記——(二)prediction題型 例1-2
每日筆記8-13
PDMA新產品開發手冊【筆記】(一)

TAG:做筆記 | 計算機視覺 | 行人重識別 |