Person Re-Identification：論文筆記3

08-26

Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Baseline)

1. 習得具有識別力的部分特徵的前提是各部分準確地對齊。現有的關於對齊的技術分為兩派：一種使用外部的線索對姿態進行評估，過程中利用了外部的數據集，另一種是對圖像進行語義分割，但是這兩種方法均有缺陷——第一種引用外部數據集時數據集的偏差將使姿態估計不準確，第二種圖像語義分割易受雜訊點的干擾。

2. 本文提出一種網路Part-based Convolutional Baseline，簡稱PCB，和一種適應性的池化方法用來對PCB進行細化和改進，即Refined Part Pooling，簡稱RRP。以下分別介紹PCB和RRP。

3. PCB的網路結構如下

從input image到tensor T的部分使用的是現有網路的一部分，譬如本文中使用的是Resnet50，將Resnet50 中的GAP及之後的層捨去，就是input image到tensor T的這部分。

之後average pooling得到column vectors g ，在進行1x1的卷積降維，得到column vectors h ，論文里將h限定為256維，最後利用全連接層得到ID predictions。

需要說明的是，從tensor T 到 column vectors g ，先均勻劃分T,再分別對每一個均勻部分進行average，從而得到的column vectors g

4. 由於PCB的均勻劃分T導致有些均勻部分中出現了離群點（outfilters），RRP正是用於對這些離群點進行重新定位，以使各部分具有內部一致性。RRP具體細節如下：

離群點的判定是通過餘弦距離得到，譬如對於某一tensor T 中的 column vector f，計算f 與 gi（i=1,2……p，i代表第i個column vector g），距離最小即認為f與gi最接近，如f為均勻部分1中的column vector，但與g2距離最接近，則認為f是部分1中的一個離群點。

對離群點進行重定位：

1）計算f屬於部分Pi的可能性P(Pi|f)，公式如下：

2）計算細化後的各部分Pi，公式如下：

RRP演算法結束。

5. 加入RRP之後的PCB網路如下：

具體演算法如下：

步驟1。將標準PCB訓練成具有均勻劃分的部分直至收斂性。

步驟2。在tensor T上附加了一個p類部分分類器。

步驟3。所有預先訓練好的PCB層都是固定的。只有p類分類器是可訓練的。該模型經過訓練，直到再次收斂。

步驟4。整個網路都經過了微調，以實現全局優化的收斂。

以上就是完整的PCB+RRP演算法。

6. 總結：本文提出了兩種方法來解決ReID問題，PCB用於通過簡單的均勻劃分策略集合了部分特徵，使現有技術達到了一個新的水平，簡單有效。RRP方法改進了PCB網路結構，增強了各部分內部的一致性。