AI Challenger開賽,用AI挑戰真實世界問題
「中國版ImageNet」AI Challenger開賽,用AI挑戰真實世界問題
遇見人工智慧 2018-08-30 20:36:19
遇見人工智慧消息2018年8月29日,由創新工場、搜狗、美團點評、美圖公司聯合主辦的「2018 AI Challenger 全球AI挑戰賽」正式開賽。
今年AI Challenger的選手們將 「用AI挑戰真實世界的問題」。值得注意的是,AI Challenger還有著「中國版 ImageNet」的稱號。據了解,本屆AI Challenger 設置了豐厚的獎金池,整體獎金規模達到300餘萬人民幣。AI Challenger是目前國內規模最大的科研數據集平台、以及最大的非商業化競賽平台,也是最強調前沿科研與產業實踐相結合的數據集和競賽平台,更是依託於數據集和競賽的全球AI人才社區。
作為主辦方的代表,創新工場創始人李開復博士稱 我們今年看到的AI儘快展現它的潛力三件事發生,第一個我們有頂尖的人才,第二個用大量數據讓人才作出有用的東西,第三個這些數據能夠落地,不能做紙上談兵指示。而AI Challenger也正是一個最好的承載平台。資料顯示,在2017年的首屆大賽中,AI Challenger以超過200萬人民幣的獎金,吸引了來自全球65個國家的8892支團隊參賽,成為目前國內規模最大的科研數據集平台、以及最大的非商業化競賽平台。聯合主辦創新工場、搜狗、美團點評、美圖公司 投入千萬元規模以上的資金,引入更多企業、大學、政府機構合作,新增十餘個全新高質量數據集,以及相關的兼具科研、產業應用、社會意義的競賽,持續打造開放的世界級科研數據集與競賽平台。用AI挑戰真實世界的問題「AI Challenger 全球AI挑戰賽」是面向全球人工智慧人才的開放數據集和編程競賽平台,致力於滿足AI人才成長對高質量豐富數據集的需求,推動AI在科研與商業領域結合來解決真實世界的問題。AI Challenger以服務、培養AI人才為使命,打造良性可持續的AI科研與應用新生態。數據是AI的燃料,開放數據集,才會更好地推動AI產業的進步。AI Challenger全球AI挑戰賽舉辦的初衷,主要源於聯合主辦方協同一致,希望在AI時代來臨之際,用開放的心態為AI產業賦能,挖掘、培養AI人才,助力AI產業的發展,並且讓AI人才有機會能拿到真實的數據,解決真實世界裡的問題。AI Challenger從第一天起就致力於踐行這樣的初衷。AI Challenger 2018 使用的數據集均為行業首創或最大,不僅在數量、豐富程度上比首屆大賽有大幅提升,而且競賽與現實問題接軌。組委會還會積極推進參賽者的成果跟產業接軌,真正做到用AI解決真實世界的問題。本屆AI Challenger全球挑戰賽由創新工場、搜狗、美團點評、美圖公司聯合主辦,在第一屆的基礎上,引入了更多企業、大學、政府機構,帶來十餘個全新的不同領域數據集,十餘個兼具科研、產業應用、社會意義的競賽。聯合主辦方在提供競賽數據集的同時,也對所提供的數據集競賽提出待選手們破解的「擂題」。
10餘個高質量數據集與競賽,再創新高在2017年的首屆大賽中,AI Challenger發布了從百萬到千萬量級的4個數據集、6個兼具學術前沿性和產業應用價值的競賽。在今年的AI Challenger大賽里,主辦方進一步擴大數據集規模,新增10餘個高質量數據集,發起兼具科研、產業應用、社會意義的競賽。其中,5個主賽道的數據集包括:業界最大規模觀點型問題閱讀理解數據集、業界最大規模細粒度用戶評論情感分析數據集、業界最大規模英中文本機器翻譯、業內首個多標籤短視頻分類數據集、以及世界龐大、最複雜的自動駕駛數據集。這5個主賽道的競賽分別是:觀點型問題閱讀理解競賽:機器閱讀理解是讓機器讀懂人類語言、和人類更好交流互動的重要領域。此技術可廣泛應用於智能搜索、智能客服、智能音箱、語音控制等場景,用AI實現基於文字、語音的人機智能互動。數據集包含30萬問題以及相關文章與答案的語料集合,為業界最大。細粒度用戶評論情感分析競賽:自然語言情感分析是機器理解人類表達和意圖的重要領域。此技術可廣泛應用於零售、電商、餐飲、服務等用戶評價場景,用AI對用戶反饋進行智能分析,監測用戶喜好、滿意度等。數據集包含15萬條餐飲用戶評論、6大類20個細粒度要素標籤,為業界最大。英中文本機器翻譯賽道競賽:機器翻譯正越來越成為人們跨越語言障礙的重要工具,應用於各種領域。數據集在2017年數據集的基礎上,總量達到1300萬句對,為業界最大;且其中具有上下文情景的中英雙語數據達到300萬句對,為機器翻譯的研究提供了更多探索空間。短視頻實時分類賽道:近幾年發展極快的短視頻行業具有明顯的娛樂性和流行性,深受人們喜愛;基於短視頻機器分類的技術還可以廣泛用於視頻內容分析、編輯與生產,監控、安防等領域。數據集包含20萬條短視頻、涵蓋63類流行元素,為業內首個多標籤短視頻分類數據集。
無人駕駛視覺感知賽道:自動駕駛技術即將改變我們的出行和生活方式。本次大賽的自動駕駛競賽採用了UC Berkeley DeepDrive(BDD)2018年最新發布的BDD 100K數據集,這是全世界最龐大、最複雜的自動駕駛數據集,包含原始圖片1.2億張、標註圖片10萬張,涵蓋多樣天氣和晝夜光照條件。除5個主賽道之外,AI Challenger 2018還開放5個實驗賽道競賽和相應的數據集,包括基於北京氣象局3年氣象數據的天氣預報競賽,世界上首個農作物病害檢測競賽和數據集,國內首個眼底病變醫學圖像檢測競賽和數據集,以3D虛擬圖像訓練機器「認識」真實世界物品的競賽和數據集,讓機器藉助輔助知識學習從未見過的新概念的首個國際性零樣本學習競賽和數據集。希望通過AI Challenger,能賽出最好的AI天氣預報員、AI植物醫生、AI眼科醫生、AI物品識別專家和AI「自學天才」。打造開放的世界級數據集與競賽平台在2017年的首屆大賽中,AI Challenger以超過200萬人民幣的獎金,吸引了來自全球65個國家的8892支團隊參賽,成為目前國內規模最大的科研數據集平台、以及最大的非商業化競賽平台。其中很多參賽選手來自國內外 AI 實力強勁的高校、公司和機構,不乏過去各類比賽的獲獎者,比如 ImageNet 兩項任務冠軍、天池阿里移動推薦演算法大賽冠軍以及 Kaggle 大賽的眾多優勝者。按照最初設定的目標,「AI Challenger全球AI挑戰賽」首先要建設緊貼前沿科研任務需要的數據集,再者是要建立超大規模的高質量數據,第三個目標是要打造開放的世界級平台。今年的AI Challenger全球挑戰賽擴大獎金池,設立超過300萬人民幣的獎金,數據集和競賽8月29日正式開放,並於12月18、19日進行競賽的總決賽答辯和頒獎。AI Challenger 2018的競賽主要分為三個階段。第一階段比賽從2018年8月29日至11月4日,參賽隊基於訓練集、驗證集、測試集A,進行演算法設計、模型訓練及評估,並提交預測結果,系統會按照評測指標實時反饋分數,並更新榜單排名。個別競賽採取參賽隊提交代碼、docker的形式進行比賽。期間進行雙周賽排名和評獎。第二階段比賽從2018年11月6至8日,開放測試集B;各競賽提交結果的時限不同。結果提交後即進入評分、排名、代碼驗證環節,個別比賽還將考察參賽隊的演算法運行效率。參賽選手在測試集B上的預測結果表現,將作為進入決賽的排名依據。
第三階段於12月18、19日進行競賽的總決賽答辯。實驗賽道數據集和競賽將持續建設,並不定期開放新內容。引入更多企業、大學、政府機構合作除了聯合主辦方創新工場、搜狗、美團點評、美圖公司,AI Challenger 2018還引入更多企業、大學、政府機構合作。包括協辦/支持方:中國氣象局北京城市氣象研究所、加州伯克利大學DeepDrive深度學習自動駕駛產業聯盟(BDD)、南京理工大學/江蘇省人民醫院、北京大學、上海新客科技、北京前沿國際人工智慧研究院;技術支持夥伴TensorFlow;教育平台支持夥伴優達學城Udacity、小象學院;AI GPU雲支持夥伴UCloud;以及指導單位中關村科技園區管理委員會、北京市經濟和信息化委員會。AI Challenger 2018全球AI挑戰賽的評委團也是大咖雲集,匯聚了來自學界、產業界的AI技術大牛。自然語言處理領域的評委團成員包括:南京大學副教授黃書劍,清華大學副教授、國家優青劉洋,廈門大學教授、中文信息學會理事史曉東,中國人民大學教授、千人計劃專家文繼榮,哈爾濱工業大學教授、中文信息學會常務理事趙鐵軍,清華大學教授、北京計算機學會副理事長朱小燕。計算機視覺領域的評委團成員包括:華中科技大學教授、國家優青、萬人計劃專家白翔,清華大學副教授劉世霞,京東AI研究院副院長、IAPR Fellow梅濤,曠視科技首席科學家、前微軟亞研院首席研究員孫劍,中科院自動化所研究員、模式識別實驗室副主任、國家傑青王亮,微軟亞洲研究院首席研究員、IEEE Fellow曾文軍。自動駕駛領域的評委團成員包括:飛步科技創始人、浙江大學教授、國家傑青、IAPR Fellow何曉飛,加州PATH項目負責人、伯克利大學BDD副主任詹景堯。
本次大賽理事會委員、創新工場人工智慧工程院執行院長王詠剛表示,希望在2018年,AI Challenger 能吸引更多國際、國內的高水平參賽團隊,並建立演算法、代碼、論文、數據、比賽的分享和交流平台。未來,「AI Challenger 全球AI挑戰賽」將持續投入,建設和發布更大規模的AI前沿領域高質量數據集,涵蓋自動駕駛、智慧醫療、智慧金融、機器人等行業應用中的核心AI需求,主辦世界級的年度AI競賽,吸引世界範圍內的高端AI研發人才,促進人工智慧科研生態的持續健康發展。將在國內外40多個城市舉辦技術論壇AI Challenger 2018 除賽事外,還將舉辦線上線下社區技術交流。線上社區交流包括官網challenger.ai上的在線社區、微信和Slack群交流,線下社區交流則包括國內外40多個城市的大學舉辦技術論壇(以下城市按字母音序排列):中國:北京、成都、重慶、廣州、哈爾濱、杭州、合肥、南京、上海、瀋陽、蘇州、台北、台南、武漢、西安、廈門、香港、新竹等。北美:美國伯克利、波士頓、芝加哥、伊薩卡、洛杉磯、密歇根、紐約、帕羅奧多、匹茲堡、西雅圖、華盛頓等;加拿大多倫多、埃德蒙頓等。歐洲:英國劍橋、都柏林、利物浦、倫敦、曼徹斯特、諾丁漢、牛津等;德國慕尼黑,法國巴黎,荷蘭代爾夫特,俄羅斯莫斯科等。亞太:澳大利亞悉尼,印度德里,日本東京,韓國首爾,馬拉西亞吉隆坡,新加坡等。此外,AI Challenger還為「中國高校人工智慧人才國際培養計劃」提供在線社區和實踐平台的支持,這是目前世界上最大的AI人才培養計劃,目標在5年內直接培養至少500位老師和5000位學生,並影響數以十萬計的學生。其中,2018年度面向教師的培訓班錄取了計算機專業排名前50高校的100位教師學員;面向學生的DeeCamp訓練營從來自全球600多高校的近7000人報名中錄取了來自85個高校的300位學生學員。「中國版ImageNet」還要實現哪些小目標?
AI Challenger被稱為「中國版 ImageNet」,AI Challenger 2018組委會認為,ImageNet薪盡火傳,AI Challenger會接棒 ImageNet,將AI挑戰精神在中國進一步發揚,打造一個獨具特色的、具有世界領先水平的高質量的數據集平台。AI Challenger今年為自己設定了幾個小目標:首先,AI Challenger提出了「用AI挑戰真實世界的問題」的口號。也就是說,AI Challenger希望在數據集的建設上,既具有科研和學術上的前瞻性,也希望數據集能緊貼AI商業化、AI落地的實際場景、實際需求,從產業需要出發,為學術研究和AI人才培養提供方向性的建議,也反過來幫助產業界更好地利用最新的科研成果,解決真實世界的最有價值的問題。例如,無人駕駛中的車道線識別問題,短視頻的實時分類問題,細粒度的用戶情感分析問題等,都是這一類的,從產業實際需要出發,又緊扣科研前沿內容的好問題。第二,今年的AI Challenger希望花大力氣,圍繞AI數據集和AI競賽,打造一個AI人才可以自由交流、開放討論、取長補短、協作互助的世界級的平台。也就是說,AI Challenger不僅僅製作、發布高質量數據,舉辦大規模的競賽,還利用數據和競賽,把人才吸引到這個平台上來,形成一種良好的人才生態,真正促進AI大環境的健康發展。第三,在AI人才選拔、培養方面,去年的AI Challenger吸引了全球將近9000支團隊參賽,參加AI Challenger比賽的有學生、科研工作者、產業一線的研究員和工程師等,來自不同企業、高校、科研機構的人才匯聚在這個大平台上,交流分享比賽中的成功經驗,每個參賽者都收穫了一段特別有價值的經歷和體驗。今年,相信將有更多的參賽團隊和參賽選手在AI Challenger這個平台上展示自己的實力。同時,基於AI Challenger的開放式社區和平台的建設,更多的人才、技術討論、演算法、代碼、文檔等,還可以在這個平台上積澱下來,成為今後相關人才培養的寶貴財富。AI Challenger的使命之一,就是希望在未來三年里,能消除中美年輕頂尖人才之間的差距,從AI Challenger走出去的優秀選手,最終成長成中國乃至世界AI產業的領軍人物。中國AI商業化和產業化進入非常時期AI Challenger理事會代表王詠剛表示,今年AI Challenger的主題定為「用AI挑戰真實世界的問題」,是有幾方面原因的。
首先,人工智慧的商業化與產業化進入了一個非常關鍵的時期,人工智慧在那些大數據積累還不完善的領域,如零售、製造、物流、農業、醫療、教育等領域,還需要經歷一個長期的發展過程,也會特別嚴重地依賴於相關場景的數字化程度。例如,對於一個線下零售賣場來說,如果沒有大數據積累,沒有攝像頭等信息採集設備收集的商品信息、行為信息、場景信息等,就沒法針對零售賣場的供應鏈和銷售渠道進行優化,沒法提供定製化的服務,沒法與擁有大數據的電子商務網站或應用競爭。因此,人工智慧的商業化落地迫切需要符合各行業需求,同時也擁有科技前瞻性的大量訓練數據集。AI Challenger希望扮演推動人工智慧商業化落地的關鍵角色,逐步在每個特定領域,投資建立並開放高質量數據,讓AI商業化的參與者能更容易地訓練AI模型,加速人工智慧商業化步伐。此外,AI科研領域一直有一種傾向,就是與產業界的實際問題距離較遠,科研成果到產業界的實際解決方案之間,轉化率較低,轉化路徑非常漫長和坎坷。AI Challenger希望在數據集建設和競賽設置上,有針對性地突出產業界的需要,圍繞產業界中的真實問題,為科研人員和工程技術人員提供最好的支持,拉進科研與產業間的距離。例如,無人駕駛中的車道線識別問題,短視頻的實時分類問題,細粒度的用戶情感分析問題等,都是這一類的,從產業實際需要出發,又緊扣科研前沿內容的好問題。2017年,AI Challenger已經成為目前國內規模最大的科研數據集平台、以及最大的非商業化競賽平台。王詠剛稱,AI Challenger在未來的發展中,會始終堅持科研的前沿性,數據集的高質量,科研與產業的緊密結合,開放的世界級平台等核心目標。以2018年的AI Challenger規劃為例,今年會突出數據集建設和問題設置方面與產業結合的特點,盡量讓AI Challenger發布的數據能直接滿足科研和產業的一線需求。同時,AI Challenger也會盡量突出人才平台、人才社區、人才網路的建設,利用AI Challenger,把全世界範圍內的優秀人才聚集在一起。主辦方對挑戰者的「幾大期待」如今,AI已經在現實世界中發揮作用,中國作為世界第二大經濟體,在大數據數量方面也具備優勢,但在AI技術創新能力方面卻仍遠遠落後美國和其他發達經濟體。AI Challenger組委會認為,目前中國AI產業仍存在很多問題,比如中國欠缺一些深入行業的AI公司,比如說類似IBM Watson這樣的、能夠針對企業需求開發數據這樣的公司,這些應用在醫療、零售、教育等領域的都會產生價值。從業界發展來看,中國科技公司相比國際AI巨頭公司,目前也有巨大差距。因此,AI Challenger組委會希望本屆挑戰賽不僅僅是一場競賽,更希望挑戰者能從現實問題出發,創造出解決現實問題的成果。創新工場創始人兼CEO李開復表示,數據、演算法、計算能力是人工智慧的三大基石,其中,數據更是人工智慧科研最寶貴的資產。如果沒有足夠好的數據,就無法取得世界頂級的科研成果,更無法破解真實世界裡的難題。希望每一位今天參與AI Challenger還有在中國做人工智慧的研究員和學生,要珍惜你們的時代,把握大量的數據,創造出最好的技術,破解產業界的真實問題!搜狗CEO王小川表示,AI正在經歷高速發展,挖掘了許多線上線下的場景。然而企業本身存在思維慣性,希望這樣一種活動,激發更多靈感,也為企業打破固有思維,做出更好、更深的研究成果,帶來新的驚喜。AI Challenger將吸引中國乃至全球的AI人才產生「共振」,將在比賽中得到知識和技能兩方面的提升。在這個年輕的舞台,我們每個人都是AI Challenger。
美團點評CTO羅道鋒表示,我們現在的日常生活,吃喝玩樂、衣食住行方方面面,都已經開始有AI在背後支撐,但是AI技術解決真實問題,仍然面臨非常多的挑戰。希望有更多年輕的技術人員成為AI Challenger,一起擁抱千載難逢的歷史機遇。用人工智慧挑戰真實世界的問題,也希望通過大賽,將真實的、有價值的、高質量的數據集回饋給科研工作者,讓先進的人工智慧技術,更好的為社會服務,幫大家吃得更好,生活更好!美圖公司創始人兼CEO吳欣鴻表示,現在已經有一種共識,認為AI是產業革命,就像蒸汽機、電力、和計算機一樣,將會推動人類的發展。AI已經成為推動全球科技進步的發動機,未來的世界,每個人在生活、工作中都離不開AI。希望在這次大賽中看到全球AI行業的最新尖端科技,與業界同行一起探索各種新的可能性,發掘出更多有天賦的AI人才和團隊。期待世界各地的AI人才彙集在AI Challenger平台上,用AI挑戰真實世界的問題!推薦閱讀:
※凈化網路空間,警企合作,阿里巴巴人工智慧鑒黃亮劍
※【大咖來解惑】無監督和有監督演算法,區別在哪裡?
※AI應用之深度學習演算法總覽
※人工智慧史上的15個關鍵時刻
※我把蒼井空的照片放進人工智慧算了算