AWS re:invent 2016:對面的序員看過來

今年又參加了在賭城舉辦的 aws re:invent。講正題之前,先黑黑程序員。

拉斯維加斯是個釋放成年人荷爾蒙的地方。各種花式賭法,無數妖艷的老虎機,美女,壯男,從老少咸宜的秀一路到R級的秀,甚至 private show,總有一款能夠滿足你。然而,程序員在拉斯維加斯的玩法是這個樣子的:

  • 晚上8點吃完晚飯特地打 Uber 回會場參加 keynote。。。Uber 司機一臉黑線日了狗了的不可理解:哥們,你沒發燒吧?
  • 聽完 keynote,各回各的酒店。路上程序員們的娛樂是這樣的:兩個看上去壞壞的傢伙沿途收集「包小姐」的卡片,然後偷偷塞到另一個憨憨的,看一眼卡片都會臉紅到彷彿就失了貞操一樣的夥伴的背包里,並以此為樂。
  • 9點半回到酒店連不上 WiFi 查不了郵件解不了 bug,內心酸楚地給前台打電話要求換房。前台接線 MM 估計下巴都要掉下來了:這 TM 是程序員打開 LV 的方式么?
  • 早上6點起來迎著朝陽 5k run,感謝組委會用心良苦讓大家感受一個哲學問題:你見過 LV 早上六點的太陽么?
  • 早上8點就開始 keynote,所以,大多數即便不願跑步的程序員7點也會起床,好在吃完早餐後開始排隊準備進場。餐廳的服務生特別不能理解這群禿頭和准禿頭們為什麼參加另一個禿頭的演講比看 crazy horse 還要興奮。

。。。

好了,這都不是編的。是真事。

去年的 re:invent 我印象是一萬多人,超過了 2014 年的記錄;今年更狠,昨晚的 keynote 說是有三萬兩千人。去年威尼斯人一家酒店就能 hold 住所有的騷年,今年不行了,額外加了 mirage 和 encore 才將將擺平。解決這麼多人吃一頓還過得去的午飯(從蔬菜沙拉到各式菜肴再到主食甜點,而非一人一個三明治或者漢堡熱狗)是個系統工程,你看:

我在朋友圈發了此圖,朋友的老婆放心了:清一水的男人啊。也是,來這裡的妹子們比 China Joy 的妹子還要百里挑一,哦不,萬里挑一。男女比例之失衡只有中國陸軍可以媲美。

今早的 keynote,全程基本無尿點,各位親可以上 youtube 一觀。我講幾個讓我感到震驚的。

F1 instance

我覺得這是讓 FPGA 工程師淚奔的一個劃時代的產品。互聯網時代把優秀的軟體工程師捧上了天,他們要麼拿著巨額俸祿和戴著正 X 品頂戴花翎在大公司里養生,要麼創立自己的產品做一方諸侯。可硬體工程師苦啊,FPGA 那都是大公司或者至少是有大額融資才能玩得起的東西,配套的設備貴到個人無法承擔,自己想琢磨點什麼,難啊 —— 哪像軟體工程師,花幾十美金,就能在雲海里自由翱翔。現在,F1 instance 為硬體工程師提供了一條和軟體工程師一樣的路子:你只需要有技術,想法和少量的錢,就可以打造自己的產品,甚至,做好的 FPGA 還可以放在 marketplace 上面銷售。也許不遠的將來,各種高性能的硬體 HTTP 層 load balancer,甚至 web server 就會誕生。

AI as a service

去年 tensorflow 出來的時候,身邊不少朋友嚷嚷著要做 deep learning / AI 方面的創業。我當時的看法是:團隊里沒有這個方向的 NB PhD,還是不碰為妙。這下不知有多少創業公司被亞麻打臉了。華創資本的熊總在朋友圈裡心有餘悸地說:這就是我們為什麼說創業公司一定要找行業應用。看圖說話,此次亞麻推出了圖片識別(Rekognition),文字轉語音(Polly),語音轉文字(Lex)三大服務。

Rekognition

(在劉江老師的朋友圈裡,說這個服務收購自中國留學生劉天強和王盟創辦的 Orbeus,經求證,的確如此。中國留學生威武啊)

這貨通過 deep learning 可以給圖片打合適的標籤。比如上面的香車美女的圖片被打上了兩個維度的標籤:Object & scene(車,戶外,白天,駕駛),Faces(女性,微笑,太陽鏡)。這個服務的應用場景太廣了,比如一個旅遊網站,把所有用戶上傳的圖片都調 API 打一圈標籤,存在 RDBMS 里,以後就可以進行激情四射的查詢了 —— 比如:國慶好無聊,想找個有山有水竹林青蔥的地方。biang,合適的圖片就被推薦到你的眼前。

Polly

Polly 看上去似乎是十幾年二十年前的 tex-to-speech 的技術,實則不然。text-to-speech 是毫無生氣的機械音,而據亞麻的說法,Polly 是 life like 的語音。要想做到 life like,不但要分詞準確,理解語義,還要把文字中的三屜饅頭(sentimental)還原出來。現場的 demo,似乎效果很好,不過我還沒有見到實際的服務,不敢妄言。

Lex

Lex 是 Polly 的反向工程,語音轉文字。這同樣是上世紀九十年代就被微軟和 IBM 「解決」的問題 —— 用過 viaVoice 的請舉手!我記得那時在系統充分訓練後就能達到 96% 的識別準確率。我用它電子化過我很多小時候的日記。然並卵,語音識別率這個東西,如果無法無限接近 100%,應用場景就受到很多限制,頂多淪為簡單的語音操控或者文本輸入的輔助工具。同樣的,Lex 的效果我也還沒有親自嘗試,亞麻也沒給個識別率 —— 但是,二十多年過去了,如果還拿 96% 說事肯定過不去。

亞麻的工程師利用 Polly + Lex 做了一個 demo,大致是工程師要訂一個去倫敦的航班。語音助手識別出來,並跟其做了基本 pass 圖靈測試的對話,然後幫工程師訂了下午五點,價格 500 刀的航班。

如果 Polly + Lex 真的可以支撐以上的應用場景,那麼我要說:

亞麻開始斷 magic 這樣的創業公司的活路了。

服務業,尤其是呼叫中心有無窮的想像空間了。也許當無人車重塑運輸業(無數運輸工人被犧牲掉)之後,呼叫中心也要被重塑了。

Snowball

去年參加 re:invent,snowball 就給我留下了極大的印象:數據傳輸靠腿,竟然比靠光電還要快!最近,我們 tubitv 有幾百 T 的數據就享受了 snowball 的頭等艙服務。這裡科普一下:snowball 是一個亞麻給你個設備,你把大容量的數據拷進去,然後通過 fedex 等快遞方式運輸到 amazon 並上傳到 S3 的一個數據上傳業務。不靠網,靠腿!它解決了大容量數據上傳速度太慢(以現有的 internet 的速度,即便開個 10Gbps 的專線,拷 1PB 數據要多久?大概一百萬秒,合 10 天!)的問題,同時保證傳輸過程中數據不泄露,不丟。

AWS 的 CEO Andy 自豪地說,這個服務一上線,亞麻就不得不把硬體的訂單增加 10 倍來應對人民群眾日益增長的物質文化需要和落後的生產力之間的矛盾。今年,snowball 升級了,不但容量翻番,裡面還帶了計算能力。我開始還疑惑這麼個存儲工具,要計算能力幹嘛,結果 Andy 就用遠洋生物監測的例子打了我的臉。在這些應用場景下,數據存儲在 snowball 里,同時可以做一些實時的,淺層的分析,等船靠岸了,把 snowball 給 fedex,上傳到 aws,再做深度處理。

嗯,很有道理。但是如果要放在雲上的數據或者從雲上取下來的數據量太大怎麼辦?像我們這樣的 PB 數量級數據的小公司,也就是幾十個上百個 snowball 能搞定的事,但是再大的公司怎麼搞?數據都放在你亞麻上,哪天俺們想自建 data center,怎麼把數據取回來?

Andy 大手一揮,一輛貨車伴隨著怪異的音樂緩緩開入會場。

起初,我們還竊笑,以為這是一個 joke,結果 Andy 說,這就是俺們的解決方案:一貨車裝 100 PB 的數據。也就是說,1 EB(exabyte)的數據,十輛車就搞定了!用 snowball 傳 1EB 數據,6個月搞定,10Gbps 的網路,26年。pinterest / netflix 再也不用擔心數據放在亞麻量太大拿不下來,被 vendor lock-in,同時,那些傳統的有海量數據的 500強,2000強公司往雲上遷移,CIO 再也沒有「數據太大,遷移不過去」的借口了 [捂臉]。

本寶寶孤陋寡聞,對 EB 究竟有多大沒有概念。查了下 wiki,得知 2011 年整個互聯網的容量,是 525EB。也就是說,5000輛卡車,就可以把 2011 年全人類的智慧裝走。。。畫面好美。

先講這麼多,淺淺的分析,見笑了。


推薦閱讀:

安恆上阿里雲了,這事兒大家怎麼看?
亞馬遜為什麼要推Serverless Architecture?
和 Amazon、Google 相比,微軟 Azure 雲計算服務的市場機會和競爭優勢在哪裡?
Windows Azure 為何比國內其他雲服務貴這麼多?

TAG:AmazonWebServicesAWS | 拉斯维加斯 | 云计算 |