全世界AI民工聯合起來

05-25

全世界AI民工聯合起來

什麼樣的工作，可以被塞爾維亞首都貝爾格萊德的上班族，和印度南部Yemmiganur小鎮的家庭主婦所共享？

答案可能出乎你意料：訓練AI。

上班族排隊等一杯咖啡的功夫，打開手機做幾個選擇題，就可以賺到咖啡錢；主婦在午後的暇時光，在手機軟體上標註方框，就可能為小孩添一身新衣。

打開Playment界面，他們會看到一張Polo衫的照片，下面描述了它的顏色、袖長和領口三個特徵，先選擇描述是否正確，如果正確則無需操作，如果錯誤則進入下一步，根據提供的選項選擇正確的描述。

他們也可能看到的是一張公路標識的照片，裡面有紅綠燈和轉向標誌，需要先圈出標誌，再選擇對應的意思。

這就完成了一次簡單的數據標註：給圖像貼標籤和分類。當然，這離真正意義上的訓練AI還很遙遠，其實只是第一步——為AI提供訓練所需的數據。

圖像識別是AI在商業中應用的常見場景。遠到自動駕駛的實現，近到電商網站的以圖搜物，都需要經過成千上萬次的數據分揀和識別訓練。

班加羅爾過去因外包產業而聞名於世，語言溝通無障礙、人力成本低廉、IT人才充足，讓印度成為了歐美大公司服務外包的首選之地。

大數據、自動化、AI等新科技的發展正在削弱人力成本的優勢。2017年，印度的外包產業受到的衝擊明顯，產值下降，利潤下滑，大幅裁員。

若最終某些勞動被機器取代，那部分外包服務將不復存在。但在那之前，AI技術的發展也給班加羅爾創造了新生計，即通過「人工」讓AI變得更「智能」。

這其中的參與者，既有擁有大量全職員工的傳統外包公司；也有像Playment這樣創業公司，用科技來做眾包的平台；還有IndiVillage這樣的社會企業，通過科技來賦能鄉村婦女和青年，改善社區基礎設施和教育。

據彭博社估計，這種數據標註和分類的工作，目前全球有超過100萬人在做。

千萬融資

亞馬遜的Amazon Mechanical Turk源於2005年為內部需求所搭建的平台：管理庫存、分類產品等。後來，平台開始對外開放，目前有超過50萬的註冊用戶，75%來自美國。它上面提供簡單的數據標記任務，用戶可以由此掙得酬勞，處理後的數據將用於AI的訓練。

隨著AI技術的發展，需要提供海量的數據對其進行訓練，類似的第三方勞務眾包平台開始興起。

2017年1月，總部位於美國西雅圖的Spare5獲得了英特爾投資、谷歌風投等聯合投資的1400萬美元的B輪融資，宣布改名為Mighty AI。這拉開了2017年AI訓練和數據分揀眾包平台資本熱的帷幕。

2017年5月，總部位於班加羅爾的Playment獲得了矽谷孵化器Y Combinator等參與的160萬美元的投資，融資總額達到了240萬美元。

據統計，2017年里，美國的CloudFactory，Mighty AI和CrowdFlower等眾包公司共獲得了5000萬美元以上的投資。與傳統的外包公司相比，它們為AI訓練所需要的海量數據提供了一個更為經濟可行的解決方案。

Playment的三位聯合創始人此前都在Flipkart工作，2015年開始創業。他們目前有30名僱員，卻擁有一個由25萬名全部位於印度的遠程「數據分揀員」組成的眾包員工社區。

即使是總部位於美國的眾包公司，他們的眾包員工很多也都來自於印度、柬埔寨、非洲等發展中國家。比如Microwork在塞爾維亞，Samasource在印度、非洲和海地等地培訓和僱傭工作人員。

人力成本低廉的優勢顯而易見。在智能手機正在快速普及的印度，經過培訓，人人都可以在移動設備上動動手指就能賺到錢，而無需像Amazon Mechanical Turk那樣總是坐在電腦前工作。

傳統的外包公司僱傭全職員工，這樣一來成本就相對高昂，Playment這種眾包協助服務就受到了青睞。其中的核心在於將數據處理的需求設計成智能手機的軟體，並按照處理要求匹配到合適的員工。

「這樣做更具成本效益，」Playment的聯合創始人Ajinkya Malasane說，「傳統的業務流程外包由於團隊固定，無法擴大規模，科技公司內部的眾包平台（比如亞馬遜的Mechanical Turk）不能保證質量。」

Playment現在擁有30多位客戶，其中包括Flipkart、Paytm和阿里巴巴集團。客戶一般按項目付費或簽訂年度合同。

據聯合創始人兼首席執行官Siddharth Mall說，他們的客戶中有大約70%都屬於自動駕駛領域。

一般而言，企業將所收集的數據提交給Playment，然後Playment的眾包員工用他們的智能手機對其進行標記、標註和注釋。這些成員通過教程接受培訓，並且必須通過特定項目的資質考察才能參與。為了確保質量，每項任務會經過多人多次重複，並設置有重複核查的功能。

「這些任務很複雜，所以我們提供專門的項目經理來為他們定製工作流程，並負責整個交付過程。」Siddharth說。

據他介紹，Playment已經為客戶標記了超過5000萬個數據，相當於大約1000萬個數據單位（圖像和文本）。他說，目前公司每天可以輸出高達100萬個標籤。

除了創造工作機會，社區也可能因此受益。電商snapdeal的合作夥伴IndiVillage Tech Solutions就在印度南部安得拉邦的小鎮Yemmiganur設立了辦公室，僱傭了大約100名婦女和青年，並將部分利潤用於社區教育和飲用水的改善。

「人工智慧」中的「人工」

一直宣稱將取代人類的「人工智慧」，何以「淪落」到需要被人類教育？聽來不可思議，但確實是真的。

Siddharth說，「雖然人工智慧是技術的下一個前沿領域，但它還遠未達到企業應用的要求。」

以自動駕駛為例，系統需要做出很多決定來應對各種不確定因素——天氣，照明，車輛類型，單行道等等。「你需要大量人力，以指數規模生成大量的訓練數據。」 Siddharth說。

之所以需要訓練數據，是取決於目前AI訓練的方式。

以圖像識別為例，原理就是給AI輸入足夠多的同一類型的數據，比如無數張貼了分類標籤的各種各樣紅綠燈、或者公路上障礙物的圖片，等下次再輸入未貼標籤的同類圖像時，AI可以將其正確分類，也就是「認出來」。

這樣一來，對於一輛自動駕駛汽車來說，僅僅是識別行人和停止標誌，它通常會需要成千上百萬的照片來學習，而這些照片必須全部由人力進行標記。

要讓AI越來越智能，直到無限接近人的判斷，就需要海量的數據讓它進行學習。那問題在於，數據的數量和質量如何選擇。對於商業應用而言，所解決的往往是具體情境下的問題，比如自動駕駛識別障礙物，以圖搜物找到同類型的商品等。

因此，一定數量的高質量的數據，顯然比海量的低質量數據更經濟高效。所謂「高質量」，即就分類意義而言，它的分類更為準確，可以起到更好的學習效果。

比如電商的以圖搜物需要訓練AI識別衣服類型，理想的狀態是所有的短袖被分為一類，所有的連衣裙被分為一類，二者之間沒有交叉和混雜。這就需要人工來對圖像進行標註，對原始的數據進行「凈化」和「分揀」。

因此，印度等發展中國家的年輕勞動力，顯然成了一個不錯的選擇。

是「智能」還是「鸚鵡」？

這樣訓練出來的AI，能真的取代人類嗎？距離這一目標的實現可能還很遙遠。

很簡單，以這種方法訓練出來的AI，它所有的輸出都建立在已經輸入的基礎之上，如果有全新的圖像出現，識別就無法進行。

加州大學洛杉磯分校視覺、認知、學習與自主機器人中心主任朱松純曾以圖像識別所在計算機視覺研究舉例稱，此前25年，主流是以形狀和物體為中心，最近25年是通過提取豐富的圖像特徵，來描述物體的外觀來做識別和分類。之前提到的電商網站Polo衫的顏色、袖長和領型就屬於此類。

但事實上，場景識別的本質是功能推理。朱松純以下面兩張圖為例，寫道「雖然圖像特徵完全不同，但是他們是同一類場景，功能上是等價的。」

這才是真正的「人工智慧」。而目前這種通過圖像特徵做場景的分類和分割，用大量的圖片例子和手工標註的結果去訓練神經網路模型，其實是典型的「鸚鵡」模式。

也就是說，這種「學習」實際上不是我們平常意義上的「學習」。一般意義上的學習，是一種交互的過程，而這種通過大量數據進行訓練的學習，其實是一種「被動的統計學習」，無法產生舉一反三的效果，只是一種「鸚鵡學舌」。

說到底，目前這種在商業應用的垂直領域應用廣泛的，通過大量數據來訓練AI的深度學習方法，只是AI領域很小的一個部分，絕對不能等同於「人工智慧」。

隨著AI技術的發展，也可能會出現比被動的統計學習更為科學的方法，那時候，還需要通過人工貼標籤來分類數據、訓練AI嗎？