從人工智慧技術的角度如何評價 Google home、Amazon Echo、Rokid 這三款產品?

最近在知乎上看到一個叫 Rokid 的人工智慧產品,貌似是國產品牌。如果以目前的情況來看,現在中國的 AI 技術能否與美國的 AI 技術進行作對比?美國有被稱為黑科技的谷歌,中國會有誰?


這三家看似都在做智能家居的中控,實際出發點和模式完全不同:

1、Google,是從演算法,從搜索引擎的角度來理解自己的產品的,更加技術范,但可能在用戶體驗上進展比較慢,名副其實的技術公司,也是目前最有可能分到人工智慧最大紅利的公司

2、Amazon,是從用戶角度出發,從產品初期用戶的需求就比技術的實施更重要,從目前已經很龐大的Skills系統就可以看出,這是一條類似iPhone的路,紮實的硬體平台加海量應用

3、Rokid,比較特別,從Rokid創業之初我就一直在關注,其產品也從5000多的Rokid升級為更便宜的Pebble,其管理團隊應該是迷茫的,在5000多的時候,他們應該是從自身考慮的技術夢想流,到新的Pebble出現時,他們在試圖接近消費者

總的來說,三種產品的定位也決定了他們未來的商業模式,Google可能並不指望Google Home硬體盈利,只是不想失去自己的搜索入口;Amazon Echo可能也不指望自己的硬體盈利,只是不想失去自己的電商用戶和新的流量;而對Rokid來說,硬體盈利是必須的,而且必須很可觀,因為對他們來說並沒有別的盈利渠道,他的路將是最難走的。

看這三款產品感觸很深,本來Rokid這種完成度的產品應該是由BAT三家來做,但是AT兩大巨頭還在深化互聯網改革,而我百已經想直奔人工智慧的終極目的地了。

目前這三款產品還是處於嬰幼兒階段,實際上並不能滿足我心中語音助手的想像,但是這又是一個非常重要的產品,因為對於ToC的消費級人工智慧產品有兩個重要的戰略要地:

一個是底層語音識別技術及機器學習能力的檔次。

另一個是產品的銷量及在用戶面前的互動頻率。

這兩個要地實際上確定了一個很有意思的競爭格局,因為要鋪開銷量、提高用戶互動的基礎是需要底層技術的完備,而底層技術又擺明了進展比較慢。

如果你是公司負責人,你會怎麼選擇?

Google選擇了悶聲搞底層,試圖在未來用完善的底層技術吊打所有競爭對手,Google Home我認為就是個試水產品,防禦居多。

而Amazon選擇了走銷量,用大量零零碎碎的應用在用戶面前刷臉,多賣一台是一台。

而Rokid在巨頭的發財的時候,開始了悶聲研發加賣貨,我真是服了,,,這是一條無比難走的路。

最後希望我國的中文體系能繼續保護國內的公司,實現社會主義吊打。

當然這種產品想都不用想,Google和Amazon別指望在國內賣,我都不同意,更別說那誰。


我回答兩句,先說下利益相關,

我是協助這次若琪月石上市的創意傳播方環時互動的cko。

知道若琪是一年多以前,朋友介紹了misa(若琪創始人)認識

我花費了5000多塊買了一個大若琪。

本身我自己就是一個電子物件的愛好者,

拿到手以後每天測試個半小時,那時候系統還不穩定,

經過一次又一次的升級和我耐心的調教。

現在大若琪,基本可以明白我聽歌的習慣,

聽的懂我快速吞音的北京話兒。

16年的11月份,若琪方找到我說一起合作,

為了研究這個行業,我購買了googlehome和amazon echo和小echo

也買了國內一些相似產品。

為了能方便使用home和echo,我建了一無牆網路。

我不是it高手,就是按照自己興趣來。

因為大若琪的售價比較高從硬體來說沒太大對比性。

恰好若琪月石的測試機那時候也出來了。

首先從語言角度來看,或許未來谷歌和亞馬遜都要進中國市場

做中文語音對話功能,但若琪出生在中文環境下多少有優勢。

其次,從反應來看,若琪在歌曲點播和準確度上略勝,曲庫沒有home豐富。

第三,從應用性來看,鬧鐘、天氣查詢、匯率查詢、睡前故事等等,三者差不多。

第四,連接智能家居,我沒實驗,看到過若琪的連接測試,比較流暢。

若琪也在繼續增加它的功能和後台支撐,我更傾向管它叫人工智慧的小玩意,

我不是人工智慧也不是it領域的專家,我只是一個愛好新奇的廣告從業人員。

這三者都有很多要改進的地方,距離真正的機器人還差很遠很遠。


看到有些回答內容,我真的是有點淡淡地拒絕的。

Echo賣得這麼好是下了血本的啊,banner位粘在上面那麼久,上百條10s廣告,美亞買條褲子膠帶上都是Echo Dot2的身影……怎麼能對比銷量看技術呢?Google home感覺沉迷技術都沒市場這方面的意圖,長遠上,我是最看好Google Home的。Rokid 第一代太貴了,完全是不顧成本地試水,而第二代Pebble都還沒正式發售有什麼可比的。

不過這問題不是分析銷量的啊,更不是看市場運營啊……(對這麼不高級的玩法,我真的要捂眼睛。)

問題是從技術上來看,不是技術人員只能從體驗上。

Google Home不了解,三個月也沒把它配網成功過,真心看不出太多。而Echo 與Rokid Pebble技術上真心差距不大。

激活方面,激活詞上雙音節的「若琪」比起Alexa明顯在炫技,而這樣必然會導致誤激活比Alexa要高。又與此相關的是,激活率也會比Alexa高。前端上,從我自己角度來看,不是演算法相關人員是不怎麼能看出技術深淺的,很多情況下感知到的只是它的產品策略。

比如說,Alexa的尋向不知道為什麼這麼差,旁邊有一點東西尋向燈就會跳來跳去。但是不能說它的尋向演算法不行,也許是出於保證其他角度的激活率。Google home沒有尋向,真財大氣粗簡單粗暴,給人的感覺是沒有尋向我依然能聽得見聽得准聽得懂。

激活速度上,Echo和Pebble的差距很小,單安靜環境下1米距離,Echo的平均大概在300-350之間,而Pebble平均大概在350-400之間。(Echo激活似乎在雲端,但是在國內美國的激活速度感覺沒啥差距,最開始我以為國內比美國要慢很多)

應用打開速度上有快有慢,但Alexa的策略要比Pebble好。比如音樂,從話音落到音樂起之間假設說Alexa的是1500ms,而Pebble的可能就只是1200ms。看起來Pebble要快,但是Alexa在話音落再到音樂起之間有個語音提示,產生了過渡,而Pebble就是單純地自己默默打開。這樣感知上Alexa就比Pebble快了。

ASR和NLP根本就沒啥可說的。Alexa真沒啥可說的。不知道官方詞錯率,也不自測過,但是我也不認為會比Pebble的好。Alexa在目前基本上跟砍掉chat差不多,單輪單次,大部分時候還都是回個sorry,I couldn"t understand.然後就休眠了。

(單輪指的是不能上下文,單次指的是Alexa說完話都會立即休眠,(WH詞開頭的問句稍微會等一會兒再休眠),再說話就需要再喚醒。)

這種做法保守得在我看來純粹是因為技術不夠來的折衷。

而NLP,反正大家都沒有多輪就隨便唄。Alexa依然做得非常保守,試圖通過訓練用戶以保證體驗。比如在播放音樂的過程中打斷它,再繼續播放。「繼續播放」除了continue,沒有找到其他表達方式。而Pebble走的是訓練NLP。

這方面,可以看下聲學在線的這篇文章。http://mp.weixin.qq.com/s/eyxZQB0wxLEXsGDCBMXmuw

TTS上,都不錯。Alexa唱歌要比Pebble好聽。不知道英語合成和漢語合成的難度係數是不是一個等級,主觀上覺得漢語的要難一些。而且對於我們來說,發現母語中不自然的地方遠比外語容易得多。再就是,Alexa就會一首歌,Pebble會的非常多,然而跟我們在KTV清唱一樣的效果……難聽的都萌起來了。

(其實我覺得小冰的TTS最好,唱歌連呼吸的氣流聲都有,簡直懷疑小冰的唱歌是錄音。補充:在若琪的live得到孟猛博士回復說還是有可能用另一種方式合成的。)

綜上,在一個比較新的領域,大家的技術都相差無幾,大家往前探索的過程都比較困難,暫時沒有誰甩誰一條街的情況。既然這樣,為何不對國內產品抱有一些希望和支持呢?

Rokid畢竟也是《福布斯》評出來的全球Top50的AI公司。

圖上的地址是Rokid的美國實驗室。原文地址http://fortune.com/2017/02/23/artificial-intelligence-companies/


Amazon的echo,Google 的google home ,rokid的 pebble 這三個人工智慧產品在本質上是一樣的。它們表面上來看是一個語音智能音箱,但實質上是一個面向未來的產品,也將會成為一種新的流量入口。它有別於傳統的PC和手機交互方式,是全新的基於自然語言的交互方式,更自然,更簡單,也更聰明。

?技術上核心內容有三塊:?

遠場拾音:能夠在超過5米以上的距離跟人工智慧設備進行自然語音對話。

自然語意理解:通俗點講的話,就是在一些話題上,人工智慧設備能夠理解人講的話。

可擴展的技能:舉一個大家都容易理解的例子,iphone手機的應用商店,就是這三個人工智慧產品有開放平台,可以不斷的擴展技能。?

遠場拾音

?遠場拾音的出現意義非常大,是人機交互體驗上突破,人們可以在家裡任意角落,輕鬆的跟?echo,google home ,rokid pebble進行交流。?雖然apple的siri,google的 google now,microsoft的cortana等語音助手很早就實現了自然語意的理解,但是都是近場的,使用上操作步驟很多,需要拿出手機,啟動助手,靠近講話。雖然在比觸控簡單,但是比遠場拾音在體驗上有本質的差距。?這種體驗上的進化,只有體驗過之後才會有感覺。可能很多人沒有使用過這三款產品,那參考之前的一個案例:在iphone沒有出來之前,很多手機已經支持了觸控操作,只是那個時候的觸控是基於電阻屏,需要用觸控筆,體驗上已經比單純的鍵盤操作進化很多,但是還是不夠自然。而喬幫主在發明iphone一代的時候一個重大創新就是使用電容屏,可以直接支持手指觸控,這種交互方式更加自然,馬上成為了主流。?近場拾音量就像電阻屏,而遠場拾音更像是電容屏,在體驗上兩者有本質差別。?對比amazon echo、google home、rokid pebble,它們在遠場拾音上性能接近,基本都能實現5米正常拾音,彼此又各有特點。三家的遠場識別採用的都是麥克風陣列 + 激活詞,從技術上來說,麥克風越多,性能越好,成本越高;激活詞越短,體驗越好,技術難度越高。?

amazon echo更加成熟,採用7麥克風+三音節激活(alexa)?google home技術更激進,採用2麥克風+四音節激活(ok google)

rokid pebble體驗更好,採用6麥克風+雙音節激活(若琪,Rokid的音譯),中國人的交流方式中,更喜歡稱呼對方兩個音節,比如寶寶,老王。pebble作為一個針對中國市場的產品,為中國人的習慣做優化,所以對中國人來說體驗更好。?

語意理解?

語意理解就是在某些指定的話題裡面,人工智慧設備能夠聽懂人講的話,目前的技術還做不到通用話題的理解,這也是業界難題,但即使是指定話題理解也已經非常有價值了。?amazon,google,rokid這三家公司在語意理解上也各有千秋,amazon將語意理解技術的產品化,工程化做的最好。通過產品設計和技術架構設計,將成熟的技術整合成優秀的產品。google演算法能力和數據兩方面最強。rokid雖然是創業公司,但其實實力不俗,匯聚了中科院語意理解方面的頂尖科學家,在演算法能力方面跟國外同行比起來並不弱,作為中國的公司,rokid更加了解中國人的語言和文化習慣,體驗細節方面也能做到更好。?另外,這三家公司都具有軟體核心技術+硬體設計製造能力。蘋果公司的經驗證明了,硬體產品要想做到極致,必須同時掌控軟體和硬體,極致的體驗必須軟體結合硬體一起定製才能做到。這也是為什麼android手機永遠在體驗上做不過iphone的原因。?

可擴展的技能?

傳統的語音控制設備的技能都是固定的,很像是很早之前的功能機,出場的時候就把所有的功能都固定在產品中。?而echo,google home ,pebbe都是開放式的,這裡說的開放式不僅僅是說可以通過雲端升級的方式增加應用,而且是將開放工具開放給第三方,任何人都可以為這些產品開發應用。而且基於語音交互的應用比基於UI交互的應用實現起來更加簡單。?echo開放了AVS系統,現在已經有了1萬以上個應用,google home通過收購api.ai也在不斷加強開放性,rokid的開放平台也已經在5月1號正式開放,應用數量也在不斷增加。由於還處於發展早期,這幾個平台上還沒有產生有巨大影響的應用,但是這跟iphone一代剛出來時候的appstore一樣,技術也不成熟,同時第三方開發者也比較陌生,應用都局限在信息類應用上,但是隨著產品的發展,這些問題都會被解決,未來在手機端的大部分應用都會出現在語音開放平台上,同時語音開放平台也一定會產生屬於語音的獨有應用。這在移動互聯網時代已經被證明過一次了。?

Rokid是一家中國創業公司,選擇的方向是最難也是最有想像力的人工智慧+硬體方向,直接的競爭對手又都是國際頂尖的巨頭,壓力巨大。但畢竟我們處在這樣一個變革的時代,作為中國人,還是希望他們可以創造奇蹟。

另外,最近Rokid的博士團也來知乎了,他們開了場live講人工智慧,大家感興趣的可以去聽聽,都是這個領域的專家,肯定比我懂得多,有不懂的可以去問他們。

傳送門:知乎 Live - 全新的實時問答

利益相關:AI行業從業者


謝邀,這個問題目前還沒有人回答,但是確實是很有趣的一個問題,我先來拋個磚好了。。。

對於Rokid,除了覺得長相比較萌,並聽過創始人當年把上個公司賣給阿里然後全換成阿里的股票之後在阿里上市時大賺特賺的神(幸)勇(運)事迹之外,我對於產品本身沒有太多的了解,所以這裡就主要談談Amazon Echo和Google Home了~~

其實,從技術的角度來說,Google home背後的技術(語音識別,自然語言處理,知識圖譜,等等)個人覺得是要略略超過Echo的,而且Google在這幾塊的技術積累也很深,當然Echo在技術上也是進步神速。但是一個合格的消費型產品需要的不只是技術,更多的是一個技術,軟硬體設計和市場切入點的綜合取捨,Echo在這方面明顯領先,2016年的大賣特賣就是證明。。

我們先來談談Echo,Echo其實一開始的功能是挺有限的,遠遠比不上智能手機上的語音助手,比如蘋果的Siri或者Google Now。但是智能音箱這個切入點很妙,首先它本身是一個不錯的音箱,而市面上質量差不多的攜帶型音箱價位也都在100-200美元之間,這樣消費者一開始購買時的心理預期就可能是這樣的:

「聽說Amazon出了個智能音箱啊,有七個speaker,音質還不錯!啊,還能語音識別,遠程語音控制智能家居產品!啊,才賣170,黑五打折才140,我得去試試!」

這樣即使Echo的功能在剛開始非常有限(報報時,聽聽音樂,關關燈啥的),用戶的心理預期也沒有那麼高,也就不會產生『這啥破玩意兒的智能啊,什麼都沒有,還花我一百多大洋』的心理落差。Echo在一開始也巧妙的聚焦在幾個主要的技術點和功能點上, Echo的遠景語音識別響應度非常高,要知道大部分美國人的房子都是很大的,echo做到了基本上在房子的任何地方喊一嗓子都能準確響應,併產生一個指向你的燈光指示,另外作為一個音箱本身,Amazon背後的Prime Music和Pandora等音樂資源讓音箱這個功能本身就得到了加強,用戶不需要在想聽音樂的時候找到不知道隨手放在哪的手機,打開藍牙,匹配音箱,點開Pandora或者Prime Music的APP,然後找到自己想聽的音樂類別(比如鋼琴曲),再點播放,而是可以喊一嗓子:「Alexa,play some piano music」,懶惰的用戶們是很容易培養起來在哪都喊一嗓子的習慣。另外一個應用場景就是自動開關燈,雖然就這麼簡單的一個功能,但是想像一下冬天可以不用忍受從被窩裡鑽出來去關燈的痛苦,多少夫婦睡覺前誰去關燈的終極矛盾就這麼得到了解決,這個功能簡直是剛需。當用戶的習慣慢慢被培養起來,Echo又會快速的迭代新的skills,持續的給用戶帶來驚喜,讓用戶有種echo像個真正小孩一樣逐漸成長越來越智能的感覺。攜帶型的Echo Tap和更精簡化的Echo Dot更是完善了整個產品線。事實上Echo Dot的音箱功能很弱,基本就是一個單獨的語音助手,如果在培養好用戶習慣之前就推入市場,就一開始那幾個雞肋的功能,我覺得是很難取得很好的成績的。但是搭配了Echo後,就不一樣了,一套完整的智能家居系統很容易圍繞Echo和Dot建立起來,比如我就在客廳放了Echo,卧室放了個Dot。

反觀Google,首先Google在AI方面基本上長期穩坐頭條,媒體整天宣傳各種黑科技,在中國更是技術創新的象徵,但是其在AI產品落地方面其實做的並不太好。比如Google早就有牛逼的圖像識別技術,但市面上第一個智能相冊-Phototime卻被我們當時的一個小Startup搶先做了出來。Google雖然收購了Nest一早就在智能家居方向布局,但是直到Echo大賣特賣一年之後才反應過來,發布了Google Home這個被評價為『無奈的跟隨之舉』的產品,即使技術上展現了更大的潛力,市場上的劣勢也不是一時半會兒就能追上來的。個人覺得這和google的文化是有一定的關係的,Google背靠Ads這個超級印鈔機,工程師可以潛心追求酷炫的新技術,沒有多少市場化的壓力,導致其對市場或者消費者心理的敏感性比不上Amazon這種電商起家整天『customer obssesion』掛在嘴上的公司。

當然,這個領域在快速發展,Echo已經擁有了上萬個新的skills了,平台效應越來越明顯;google背靠Android和Google強大的雲端服務,比如地圖,Youtube,搜索等,也絕對不甘於一直被Amazon壓著,未來這倆家的競爭還是很有趣的,看看最近這兩家的股價,吃瓜群眾表示很興奮,準備搬著板凳圍觀!


背景:

工作原因,體驗過Echo和Rokid,Google Home只看過視頻。從產品角度來看,目前此類產品的使用存在硬體、軟體、功能、內容、設計、使用環境等太多制約因素,AI對於體驗的提升難以明確感知。

此類產品中AI的前端應用方向一般包括(後端不清楚):

1 語音識別與合成效果優化(軟硬體);

2 用戶模型構建與分析;

3 功能、內容使用場景優化等;

三個產品在AI方面的技術應用感知:

Rokid據說在語音識別方面有AI相關應用,由於其他因素短板效應太強,無法感知。用戶模型及功能內容方面的應用尚不清楚,但基於公司規模和相應資源考慮,應暫無精力深入。

Echo在三方面都有AI應用,其語音識別合成方面體驗優秀,AI應當貢獻一定功勞。用戶模型方面,基於其不斷增長的用戶量與使用頻率,AI在這塊應當也在持續跟進優化。功能內容使用方面(自身加第三方),相應AI應用應當是定點、局部深入優化。

Google Home在語音識別方面應當與Google語音搜索的AI技術應用比較接近,但實際體驗不清楚(使用環境、軟硬體制約)。用戶模型與功能內容方面,與Google整體一致,應當有較早的AI應用,但不清楚有無對語音硬體產品的針對性優化。

國內大概:

科大訊飛在語音識別與合成方面的AI應用有一定優勢(其涉及了硬體以提升實際效果)。其他兩方面暫不清楚。

百度在語音合成方面應當基於其百度語音搜索上的AI應用,但硬體及軟硬整合方面不清楚。用戶模型與功能內容方面基於百度自身資源,相應AI技術應當整體適用,針對性優化不清楚。

出門問問在語音識別與合成、硬體、特定場景應用方面都有一定探索,具體體驗不清楚。

思必馳等尚不清楚。

AI技術在產品上的應用與國外相比 (不同於比賽或發paper),語音這塊的效果難以衡量,畢竟語言、生活環境不同。用戶模型及功能內容方面應當是固有差距。

以上為個人理解,不恰當之處請包涵。


這三個我都用過,Rokid這個是在CES上見到的,像個小石頭,還得了個什麼獎,印象還比較深刻。

老實說,Rokid也就是國內的一家創業團隊,和Google,Amazon這種巨頭比,吃虧了。國內這塊本來應該由巨頭著手研發的,但貌似國內互聯網巨頭們都沒什麼動作。有的話也都是收購,之前不是有個也是做智能家居的渡鴉科技么,也是個創業團隊,後來就被百度收購了。

可能是巨頭體量太大,不好掉頭吧,所以就給創業公司一個機會,誰做大了,就把誰收購了,也算是一個辦法。

其實中國在人工智慧這塊的水平不算太低,而且因為這種產品比較敏感,可能涉及信息泄露之類的,國外的產品不會被允許在中國售賣,政策上也會給國內的廠商很大的支持。所以國內這塊創業還是有機會的,我個人是看好的,就希望國內的Rokid們多加油吧。


因為愛好電子產品,這些東西我都接觸過。

怎麼說呢,就目前的技術水平,還達不到做出一個好用的語音助手的程度,這裡面涉及的東西太多了,單讓機器能聽懂人這一個就有語音識別,聲紋識別,遠場語音識別等等,且不說之後的操作,計算,學習之類的,涉及的技術太多了。

但我覺得這個需求是存在的,我就很需要一個語音助手幫我處理一些生活中瑣碎的操作,節省時間和精力,這顯然是未來的一個趨勢。我家人和朋友也很喜歡這些產品,有時候小朋友來了,也玩得不亦樂乎。

所以,現在這些廠商集中做這種產品,倒不是純資本推動的,沒有需求的一個東西。需求確實存在,這就有點像VR,需求存在,不過技術暫時還不夠,還需要一些時間。

現在這麼多廠商在研發,競爭這麼激烈,也是好事,有競爭才會有突破,希望不久的將來,我們能用上真正的語音助手吧。


因為工作原因,這三個公司的五款產品我個人都體驗過。包括Google Home,Amazon Echo,Echo dot,Rokid Alien,Rokid Pebble。 Google Home、Amazon Echo、Rokid Pebble這三個是對標的,這裡就來給大家分析一下。


Google Home

Amazon Echo

Rokid Pebble

對於AI智能音響,從AI技術上來說,最主要的就是ASR,NLP和TTS技術。每一項技術都可以說上一長篇文章。我們就從簡單的語音輸入輸出這個較簡單的角度來看吧。


比如你說一句「xx,你好嗎?」機器能夠知道你在跟他說話,而不是跟別人說話,需要一直聽xx這個喚醒詞,這個過程叫喚醒。因為是家庭場景,機器需要清晰的聽到你說的話是什麼,但因為距離遠,所以必須要有方向感,通過麥克風陣列把其他方向的噪音屏蔽掉,專門向你聲音傳出的方向聆聽。這個過程叫拾音。 就我目前的體驗來看,喚醒速度,Echo和Rokid旗鼓相當,差距幾乎在幾十毫秒內,而Google Home則略慢。


從喚醒詞來看,目前Echo是「Alexa」,Google是「OK,Google」,Rokid是「若琪」。喚醒詞一般是三音節syllabus,而要實現三音節以下則難度很大。Echo是三音節,Google是四音節,Rokid是兩音節。Rokid能達到兩音節喚醒,並很少誤激活,老實說對一家startup來說是個不小的成就。


再來看拾音,拾音有一個重要的技術要AEC,簡言之就是音響放歌的時候它可以自動做反向屏蔽,即使音響音量很大但同樣能夠聽到你喚醒說話的聲音。三家對比,Amazon和Rokid的AEC技術相當,Google幾乎沒有。每次放歌時我都要大喊大叫,但這都很難喚醒Google Home。所以我很懷疑Google是否加了AEC技術。

好了,有了喚醒和拾音,聲音好不容易進來了,那麼怎麼能判定你說的什麼內容呢?首先需要ASR技術,就是把你的話轉成文字。具體怎麼做,這裡省略一萬字……這塊的話,這三家的技術都比較成熟。


轉成文字以後,還要理解裡面什麼意思,這就需要NLP技術。同樣,這三家在理解句子意思上幾乎沒有差別(當然前二者是英文,Rokid是中文)。個人感覺,中文的ASR和NLP會更難一些,因為中文的語調和同音字太多了。


理解了意思,就要access information了。這塊不太涉及AI技術。Google在信息方面是最強大的,擁有Google account和生態里強大的content系統。尤其在聽歌上,可以直接從youtube上播放,雖然音頻質量不高,但曲庫龐大。


Amazon也是一樣,可以通過echo購物,同時擁有上萬個第三方開發的skills。


Rokid也擁有自己的曲庫,號稱是600萬,中英文均有。但在其他content和skill上還無法與前兩個巨頭相媲美。不過據說Rokid目前也在做自己的開放平台,相信之後會有更多的skills出來。


Content拿到了,就要給反饋出來。讀文字技術叫TTS。這種技術已經成熟很多年了。現在拼的主要是有多像人的聲音,需要機器學習和大量的人工work。


目前來看,Amazon比Google更像人聲。Rokid不好橫向對比,但人聲感覺接近Echo,居於Echo和Google Home之間。


限於篇幅,就解釋這麼多了。


這三款都是好產品,不過就我目前的使用時間上來說,是Rokid&>Echo&>Google Home。畢竟是中國人嘛,還是用中文的系統更溜。


誒,技術層面的講不過大佬,但是可以講講實際體驗。

Google Home開賣後第二天就買了,然後配套買入的還有Nest Thermostate, Philips Hue 3rd Generation, Google Chromecast最近還要加上新買的安卓系統的S8也搭載了Google Assist,應該算是一個家庭內很健全的谷歌系智能家居系統了。到現在用了小半年了,說說感受。

智能么?我不敢說Google Home很智能,起碼還沒到我想像中的智能。對,它是整個智能家居的首腦,你只要對它下命令就可以控制家裡的電燈,空調和電視播放內容。

可是呢?我說一整句"ok google, turn on the light in the livingroom"和我用手去按一下燈的開關,哪個更省事?如果說控制家電的話,我最近看到的一個手環更為智能,只要你設置好手勢,揮一下手就能關燈,更方便和人性化。

智能家居方面再說說電視。插上chromecast之後,你用google home能做的就是選擇播放內容,不能調節音量,不能開關電視。那麼你語音命令一長串才能找到你要的節目(還有可能不被識別),相比起來真的比傳統控制方便么?

更不用說菲利普的燈泡組件到現在在安卓系統上還沒辦法根據地理位置自動亮燈等一系列bug了。一個主打智能電燈的大廠,這麼基礎的一個bug我查了查國外論壇上半年前就有人反應這個問題了,到現在還沒解決。這周邊配套的硬體都沒有那麼智能,google home離我認為的智能也差很遠。

再說google本身的人工智慧。我認為google home里的AI比安卓系統帶的給我的感覺要差,可能是應用環境的問題。舉幾個例子。一是有一個功能叫購物清單,你可以把你要買的東西告訴google讓它記住。然後呢,問題是你沒辦法語音刪除清單內的內容,你要用手機點好幾步才能刪除,智能么?二是有一個東西叫備忘錄,比如說你可以讓谷歌記住你告訴它的你的密碼是1234。然後同樣的問題,這個信息刪不掉,而且就算你用手機也刪不掉,永遠就存在在那裡了。並且你讓谷歌記住的信息不能包含一些特定關鍵字,不敢你一提到關鍵字,它直接給你搜索答案去了。智能么?三是我讓它隨便放一些音樂,好的,那麼在接下來的三個月里你每次讓它放音樂都是同樣的歌單同樣的順序,並且還不能隨機順序播放。智能么?

不多說了,google home讓我覺得不滿意的地方遠遠不止這些。給我的感覺google home不過是一個語音識別器而已,跟智能還差的很遠,根本稱不上AI,包括你用IFTTT編寫google home指令的時候它能做到的還是抓取關鍵字,它根本沒有【理解】你的話。

那麼再來比一下Echo。Echo智能么?並不,最起碼不會比google home好,它甚至不能查看你的日程。然而作為一個智能家居首腦,它比google home稱職。起碼支持echo的智能家居硬體比支持google home的多很多,而google home出了這麼久,我知道的,或者說真正值得使用的還是nest和philips家的東西,根本沒有擴充產品線。

所以,綜上所述,目前智能家居,離我認為的智能,還差很遠,可能並沒有讓我們的生活更便捷。


最近真是夠了,看Rokid在知乎的廣告滿天飛,今天還出來了標題黨:「我還是人嗎?」對啊你本來也不是人啊!中國的人工智慧產品呵呵,在網上搜索了一下相關的信息各種裝X的PR文滿天飛,銷量呢?怎麼不敢寫呢?根本賣不出去吧嘻嘻。奉勸知乎在商業轉型時候不要亂合作這種公司,招黑!


突然發現這個問題越來約有意思了,Rokid的公關團隊都開始上來洗臉了。不過反應速度的好像有點慢了。

更有趣的是,環時互動的金主任都出來站台了!回答下竟然還有8個點贊?不過金主任回答貌似顯得很中立。一方面表示Rokid是有在和自己合作,另一方面表示這次事件和自己沒有半毛錢關係(貌似在甩鍋)。不過這些點贊者的出發點到底在哪?好想知道這些人是站在哪一方的?環時互動?還是Rokid?但,不得不說金主任的這一步棋走的確實很漂亮,不愧是玩營銷的!厲害~

回歸主題,很多人談AI不在一個頻道上,雞同鴨講,一知半解。

其實AI架構從下到上有三個層面

模型和演算法層面:深度學習、神經網路、機器學習,路徑規劃,狀態空間搜索和優化,perception,LSTM,CTC,CYK,HMM ;

技術層面:環節感知,定位,移動,計算機視覺,語音識別,自然語言處理,對話,邏輯推理;

產品層面:機器人、Google Home、Siri ;Amazon Echo,小智音箱、叮咚音箱、Rokid 等。

模型和演算法層面創業公司機會很小,因為是巨頭的天下;對於技術層面來說,創業公司也很難有機會超越這些巨頭公司。

產品應用層面,需要綜合考慮演算法、技術以及產品用戶體驗創新、使用場景創新等方方面面因素。 技術永遠只是相對壁壘,沒有絕對壁壘,做出好的產品,打造一流品牌,獲取海量用戶才能形成壁壘。綜合來看,創業公司如果打法聰明,務實,還是有逆襲的機會。

如果換個角度去觀察問題,AI產品層面的創新雖說基本上都是創業公司在推動的,但最終還是寡不敵眾,被巨頭給吃掉。當年的塗鴉科技就是一個很典型的例子,後來被百度給收購了。事實已經證明,AI這個領域創業公司將很難玩起來,最終還是被掌握在巨頭的手裡。作為創業公司的Rokid又該如何去面對這嚴峻的挑戰?

對Amzon而言往AI領域發展,也是必然的選擇。Amzon Echo就是一個很好的開端。

AI這個領域就好比一艘大游輪,你兜里的金錢數量最終將決定你行駛的里程。

對於創業公司而言,如果光靠資本的注入,沒有一張漂亮的成績單,估計也將很難長遠發展下去。


我其實是比較奇怪為啥中國沒有山寨echo的,WIFI在國內普及很大,沒理由不山寨echo。

至少在兒童教育上,就能打開市場的。

國內怕小孩子上網玩遊戲以及近視,很多家庭限制了小孩子接觸電腦與互聯網。

反正,我覺得是做產品的人不行啦。

也許,有空時間,自己去做一個。

學英語,做作業,時間管理,播音樂,這都是echo 類最開始可以實現的功能。


ROKIC勝在工業設計和人機交互。為什麼這麼說?但價格和體驗卻遠遠不如外國的兩個智能產品。

原因1:工業設計才用了圓圈?的概念,通過光反射,形成類似外太空過來的「人」,具有中國元素表達,也有科幻色彩意境。理念太深奧,卻沒幾個人能理解的。而外國的這兩個產品都屬於日常生活用品,平民化。

原因2,人機交互才用了視覺+聲音+環境感知等。人的視覺是最重要的交互手段,一個眼神你就知道對方的意思,一個閃亮就知道機器正在操作等等。而後兩者只有語音交互,這種體驗讓用戶不知所措。有時候因為等不到機器的信息反饋誤以為機器掛掉了。而亞馬遜的下一代產品,也會加上視覺識別,通過屏幕或者投射等方式實現。

在功能上,不用說,Rokic是個弱智兒,一問三不知,答非所問,除了一些查詢,啥也幹不了,目前屬於特別弱的人工智慧階段。而谷歌和亞馬遜的音響,技能有1000種以上,解決日常的一些查詢和購買等問題。國外的兩個產品把產品生活化,低價,降低用戶購買門檻,提高用戶日常使用次數,讓人工智慧像水和電一樣進去人們的日常7訂生活。Rokic卻以一種高姿態遠離人民生活,失敗在所難免。


時間軸上最近全是這個rokid,好煩。這個東西跟另外兩家完全沒有可比性。唯一就能當個音箱使了。可是這個團隊審美太奇葩,弄了那麼個界面,怎麼看怎麼尷尬,還起了一個中文名叫若琪還是什麼的。官方拍的幾個智能家居的例子,用的那五顏六色的燈,直接拿去「你見過最丑的裝修是什麼樣子?」那個問題,估計不拿個一千贊都不可能。技術底層我不評論,做產品來說這個團隊的審美太差…5000塊的售價,我買個bo不好嗎?我買個bose不好嗎?我買個幾百塊的木頭藍牙音箱不好嗎?我肯定不往家裡放這麼個東西,太丑。

避免跑題,還是說一點技術的事……google和amazon都有自己的生態,有自己的內容。這個若琪呢,可以給你講故事,用的內置的喜馬拉雅網易雲音樂之類的,全是第三方,所以我說他就是個音箱…

沒有利益相關,就是提醒大家注意自己的審美,google和amazon的東西可以說好看可以說一般,但是很難說丑,這個若琪呢,丑。


1.

很驚訝,在這個問題下看到了環時互動金鵬遠的答案。

我看過Rokid出的一些應該尚未公開的宣傳短片,結合最近兩天該公司在知乎瘋狂打的廣告,可以說下三路性暗示是這輪宣傳的重點之一(具體就不說了,短片里呈現的東西,遠比「若琪關燈,我要辦事」更赤裸裸)。

這個宣傳手法和環時互動金鵬遠聯繫在一起,我覺得難以置信,因為從杜蕾斯案例能看出,金鵬遠和其團隊在尺度把握方面一直做得很出色,而這個,純粹的博眼球水平。

2.

我司展廳里現在就有這個語音機器人,基本上,銷售就是拿來當藍牙音箱用——智能家居面臨的最大兩個的問題:

喊一聲,我能幫你關燈,能幫你開空調關窗帘,能幫你...

(1)沒錯,可是,如果你家裡各種電器傢具沒有安裝適配的模塊並組網,這些功能真的能實現嗎?不能。

(2)這個語音助手的體驗,真的好到我們需要它去干這些事嗎?

目前從官方文案看,這兩個問題並沒有真正的解決思路,宣傳的重點依然在於語音交互(幫我點歌,今天有什麼新聞),說白了,和Siri、Cortana等相比,最大的優勢是「我音質比手機好」??!

3.

挺捨得花錢做宣傳,走無下限搏眼球路線可能也算嘗試——嘗試拉近高大上的智能家居與普通人的距離,但這條路真的正確嗎,我個人持懷疑態度。

尤其是,智能家居本身並沒有獲得突破性進展。

PS: 智力正常的人都能看出來,這個問題硬廣味道不能再濃,不走心。


能聯網的麥克風?這種東西我怎麼感覺可能會暴露隱私啊!

有沒有跟我一樣想的?


我的看法都在這兒了:


不是我說,rokid反應太慢了!


其他的不知道,在美國的時候用過Echo,我簡單說說這個吧。

不支持中文,不過作為英文語音助手,比siri還是強一些的。遠場語音識別方面還行,離得稍微遠點也能聽清楚。

其他功能上面,查查天氣,交通之類的,離真正的助手差的有點遠,就是個功能多點的藍牙音箱。

如果國內要用,首先得懂英文(不要想有中文版),然後肯定很多功能不行了,比如查天氣查交通,肯定沒有,只能做個鬧鐘……以及當音箱。

雖然是音箱,不過畢竟不是主打音質,所以音質方面……

所以啊,站在AI角度來說,這些產品(至少Echo,其他的也差不多水平吧),還遠不到能當助手的程度啊。


推薦閱讀:

TAG:人工智慧 | 自然語言處理 | 語音識別 | 智能音箱 | AmazonEcho |