不斷發展的語音識別和語義分析技術對互聯網世界會有怎樣的影響?它們更可能成為大公司屏蔽競爭對手的護城河還是創業者顛覆市場格局的殺手鐧?


這個問題有兩個部分,我分別來回答:

首先,語音識別和語義分析技術會對這個世界帶來很大的改觀,但是對目前一代的互聯網是不可能產生顛覆性的影響的。 互聯網的強大在於其很多方面的功能和體驗是超越線下的, 比如IM軟體,比如CRM, ERP,再比如facebook, 在現實社會沒有一個類似功能並且效率接近的產品可以被創造出來。

再往前一步分析,移動互聯網被熱捧也是因為超越了互聯網, 比如talkbox,foursquare在pc上是不好用的,只有移動終端才可以發揮其最大的威力。 互聯網對於語音語義技術的大眾需求不是很大, 如果只是針對少數群體,那麼不會對這個世界產生可觀的影響。 畢竟語音語義技術即使要在互聯網中使用,替代的無非也就是輸入設備, 輸入設備現有的有各類鍵盤,手寫,滑鼠,觸屏,包括移動終端的二維碼。事實證明,對於人類,聲控的輸入設備目前還不能完全取代視覺型的輸入設備。拋開語音語義技術的技術困難來說,其完美表現對於現有輸入無非也就是聲控開關對於 按紐開關的提升而已。

在移動互聯網上,因為隨時變換的場景可能對聲控有很高的需求, 比如你在開車無法放開雙手,你就非常需要聲控輸入。 如果在物聯網上,語音語義識別的作用可能會非常大, 因為輸入終端可能是非常簡單而低成本的設備。 微信這樣的不屬於語音語義技術,因為接收和識別者是人而不是電腦。

第二部分的問題答案非常明顯, 在現有技術的前提下,語音語義技術必將被大公司進行壟斷,並且做成服務提供給小公司。 目前語音語義技術需要學習能力,計算機的學習就是採樣,通過龐大的資料庫進行智能分析, 數據的壁壘很快就會形成, 小公司很快就沒有足夠的成本去競爭。 如果硬要具象一點的例子, 此類壁壘類似google, google map,以及facebook這樣, 你的數據足夠龐大,門檻自然就建立起來了。

而目前的情況,沒有絕對佔有市場份額的此類技術(siri的應用還在很初期),創業公司是有一定的機會的,也許未來移動互聯網和物聯網就會有一股新生力量靠著語音語義技術崛起。


總的來講對於大公司和小企業都有很多機會。

語音識別技術和語義分析技術只是兩種技術,這兩種技術的數據門檻在語義分析上會很高,大量累計互聯網數據的公司(搜索引擎和輸入法公司,這在中國市場都是大公司)在這方面會很有優勢。語義識別技術也是互聯網智能化和下一代人機交互的基礎。

因此語義分析帶給大互聯網公司的競爭壁壘還是比較高的。但同時,小公司也並不是沒有機會,在一些利基市場,語義分析是可以由一些特定演算法實現的,這個的基礎是語言學的基礎,數據對於語言學基礎作為修正。這讓一些特定領域的語義分析成為商業企業和學院結合可以發揮巨大作用的領域。

總的來講,未來的產業鏈應當是,有很多語音識別技術的供應商,作為人機交互的一個基礎技術,這個供應商可能來源於一些細分領域進行語音識別技術的企業,不會是特別大的企業。其次有大型企業提供基礎的語義分析技術(騰訊、百度)實現基本的最廣泛用戶的下一代人機交互的產品基礎,當然他們也會衍生出很多相關的產品來滿足需求。但是在很多細分領域,特別是專業性領域,更多的專業公司開發出更精確的針對該專業的語義分析技術,搭配語音識別軟體,開發出產品提供服務。

還有一個可能的細分領域,就是跨語言的語義識別和轉換技術,這也會是專業小公司的市場。

因此,大型企業的廣泛領域有巨大優勢,但是語義分析會催生更多利基市場。


如果技術只對現有產品起到優化作用,則依然是大企業的囊中之物。一般稱之為改進性技術
如果技術能形成新的市場和產品形態,創業者機會更多,比如圖形界面對於dos界面,觸摸屏對於鍵盤。一般稱之為破壞性技術

總的來說,語音識別和語義分析屬於破壞性的技術,小身段的創業者更有機會成功。
1 創新需要從小處入手,而非開始就大而全。
最典型的失敗案例是摩托羅拉銥星計劃,"讓用戶從世界上任何地方都可以打電話"。高超的技術、全新的衛星系統,但從產品構想到推出耗時11年,再加上超高的價格以及移動通信的崛起,導致它遠遠脫離市場需求。
突破性創新產品的初期市場很小,無法滿足大公司的收入和增長要求,這決定了大公司流程和價值觀不會選擇創新為主業務,被安排做創新產品的人也會抵觸它。小型創業團隊的靈活性和生存壓力更適配於初期市場的規模。
微軟、IBM等大公司在語音上已投入很多年,還沒可見的產出,不能因此說小公司沒有資源更搞不定。 正是因為大公司從技術出發在做憑空想像的大東西,而小公司一般能從小的市場點切入,能夠根據市場反饋持續調整,市場才是最好的驅動引擎,市場會帶著小公司走向成功。

2 蛋糕不只是一家或幾家公司的
語音是基礎性的創新,會有一家或幾家大公司積累了平台性的數據和技術,但最直接並給用戶最多價值的,是各種各樣的應用,它們是生態系統中最有影響力的部分。

語音技術未來發展可想的幾個階段:
1 作為文字輸入的語音識別
屬於改進性。從碎碎念的微博,到長篇大論的知乎、博客,都不會因為語音識別方便輸入而產生全新的產品形態。會讓微博更隨意,隨便喊一嗓子就能發,但很難催生新的產品類型。

2 作為交互模式的語音識別
是破壞性的。說話不需物理運動,解放了人的雙手。相對於鍵盤,甚至觸屏,都有明顯的優勢,是更懶、更自然、更簡單的交互方式。比如以下場景:家裡有個支持語音識別的控制中心,人懶洋洋的躺在沙發上,想看電視,喊一聲,開空調,喊一聲,隨性所欲。這比到處找各種遙控器舒服太多。再往遠一點看,當人工智慧成熟,機器人普及的時候,語音是最理想的交互方式,我們像和家人一樣和機器人交談。

3 語義分析
毫無疑問,是完全顛覆的破壞性技術。
讓機器聽懂人的語言,是只能不斷接近的夢想。需要持續的積累大量的數據,數據多一點,優化多一點。
一開始就以完全智能為目標的創新不靠譜。垂直領域、具體場景和局部的創新,會不斷湧現,比如今天天氣好不好,現在幾點鐘,哪個飯店好吃。。。。


首先:語音識別和語義分析的成熟,將使信息技術大步躍進成為一種生活中最重要的基本需求,並且這種需求具有不可替代性。甚至可以將其比作電力普及應用的意義,對整個社會生活將產生重大影響。相比較而言,信息技術到目前為止都很難說已成為一種想電力那樣的、必須的、完全不可替代的需求。我認為這是對技術進行斷代的一個重要分水嶺。參見我對馬化騰本次提問的回答。

其次,語音識別,特別是語義分析的技術難度極大,就計算機科學的發展階段而言,目前還遠未到成熟,這點大部分專業人士都應該認同。還需要重大的理論突破。所以要下結論說是護城河還是殺手鐧,目前看來還有些為時尚早。即便是siri,也遠未看到成為護城河的可能。

當然,這兩者的能量實在大到不容忽視,如要提前做一些判斷,可以這樣分析:
一、這兩個領域都是非常深的科研課題。就科學研究而言,大部分由小團隊完成。大公司的幾個團隊和獨立的小的研究團隊相比,不見得有多少優勢,因此誰先突破還很難說。
二、在這兩個領域進行研究的團隊,全世界非常多,存在於各類公司、研究所、大學、甚至學生團隊。就數量而言,大公司的研究團隊數量在其中占很小的比例。

因此,從概率角度看,我更傾向於未來成為小團隊「殺手鐧」的概率更高,而且這種重大基礎創新,如果出現在小團隊,未必會輕易出現收購行為,甚至有可能先在開放的學術環境出現。因此,成為壟斷者的護城河的概率並不高


先說個親身經歷。大約在1999年的時候,偶爾看到一則新聞,講的是一個患有青光眼、嚴重弱視的用戶是如何通過讀屏軟體和語音軟體來幫助自己使用電腦和上網的,效果還不錯,所以一時心起,買了個D版的IBM ViaVoice 98回來嘗試。看介紹說是輸入識別達到90%以上,是當時最先進的語音識別軟體。裝軟體是很快,但根據它的安裝指示,進行的語音識別練習可把我折騰死了,為了讓音量和標準度一直能進綠線,我大聲朗讀所有的範文,一直折騰到半夜一點多才算完事,四五個小時下來,口乾舌燥的,還被父母教訓。可最終的結果還是相當讓人失望,通過語音控制命令調用程序並不是很理想,打開文本進行語音文字輸入的效果更差,最後,勉強用了幾天後,還是把它刪除了,省出幾百兆的硬碟空間。

之後除了用過Siri,其它的語音識別軟體就沒再用了。感受是目前Siri的使用上還不是很方便,不支持中文,搜索結果對中國區也不是很理想。

但我們不能否認的是,語音識別技術蘊涵的巨大力量。口頭語言的交流比文字和圖像的交流更廣泛、更方便、更簡潔,在日常生活和工作中比後兩者佔有更重要的地位。我很願意用語音來控制家裡的電器工作,以便能解放雙手來做別的事情。如果能把語音識別和控制技術完善至民用級別,那麼隨著而來的應用浪潮就能帶來一場新的商業革命。

同樣的,對於語義分析技術來講,即使撇開與語音技術結合所能產生的威力,僅考慮它在自然語言處理、信息甄別、分類上的功用,就能幫助我們有效處理互聯網上海量的信息,提升知識庫、商業智能等方面的應用水平。當與語音識別技術結合後,互聯網的人工智慧水平會更上一層樓。

不得不說的是,不管是語音識別還是語義分析技術,都是強技術類型的,它們很依賴於實驗室研究和工業轉化,在轉化成產品推向大眾市場之前,它們已經不知道在實驗室里被多少人研究和完善了多少年了,識別率才有了百分之幾的提升。在這個領域裡,大公司比小公司或創業者擁有更多的資金和技術實力,這使得他們擁有更多的力量去建立行業標準,提高競爭門檻,或是通過專利大棒來打壓競爭者。


當一個用戶需要找客服的時候,絕大部分人更願意找人工客服而不是機器。
主要是因為一方面人工客服可以語音對話,而不是文字輸來輸去;另一方面,客服可以靈活應對用戶的問題,比現有的機器溝通效率更高。以上兩點,前者說明語音是比文字更高一級的交流工具,後者說的是對面的語音解析一定要足夠智能。
所以,當語音識別和語義解析技術發展到足夠高級的階段時,各位可以想像會發生什麼樣的事情。用戶使用手機做各種查詢,各種搜索的時候,就像在跟一個人工客服在溝通,還有人不會用直接說話的嗎?影響到的應用,比如搜索引擎,地圖,電商等等太多了

第二個問題,是壁壘還是創新。
語音識別和語義解析是一個太大的範圍,沒有任何一家公司能把全程業務包斷。我認為技術上面的領先會使得部分公司掌握底層的核心能力,是競爭壁壘;但是業務層面上,一定是百花齊放,各個能夠調用到語音語義基礎技術能力的創業公司必然對現有業務帶來破壞性的衝擊。


1、音語義技術,對未來的(互聯網)世界會有顛覆性的影響,比如機器人、車載、AR/VR、物聯網等場景,由於「不方便用手」等特殊情況,都會需要語音語義交互。


2、更有利於大公司還是創業者?分國內還是國外。

1)在國外,是大公司的護城河。因為

  • 大公司非常願意收購相關的創業團隊或人才。因為1)他們認為語音語義技術,能和其產品形態或數據結合,創造巨大價值;2)價值觀角度,尊重技術專利及創新,不願意自己做(巨大的機會成本)。3)看到其他大公司在儲備「核武器」了,自己也趕快買。
  • 創業公司或人才,也願意被收購。不僅是錢的問題,巨頭的數據渠道等各種支持,也是能「把事情做成」的關鍵因素。
  • 實際上,國外-語音識別領域的軍備競賽,已經結束
  • 國外-語義/AI領域的軍備競賽,即將結束
  • 創業團隊都被收購了,所以只能是大公司的護城河了

2)在國內,小公司機會更大。因為

  • 大公司,特別是技術型的大公司(如百度),更傾向於先自己做。但國內的大公司能做好嗎?個人持保留態度。因為這種顛覆性的技術變革,一般都是從一個很小(垂直)很小(不明顯)的點開始的,而大公司的決策層,首先對這個垂直領域可能不熟悉,進而「體悟」不到那麼細的地方;另外,他得兼顧公司層面的戰略目標,執行時不能像創業公司一樣「all in」,還有一些大公司病就不說了。
  • 大公司如果要投資(收購),一般得等觀望到市場即將爆發,或者需要戰略性「查漏補缺」時,才可能進行軍備競賽。值得注意的是,一旦被BAT定義為「基本技能」,被收購會非常順利,比如在地圖領域,阿里收購了高德(10.45億美元),騰訊收購了四維圖新(11.73億人民幣)和科菱航睿(6000萬人名幣)
  • 所以,個人預計,先有1家創業公司單點突破,然後大公司趕快來收購他或者後面幾位的創業公司。
  • 為什麼小公司能成呢?除了「願意」從很垂直很小的點切入,還在於小公司的方法可能更有效——大公司,有些人是科研機構出來的,中規中矩;而小公司,有時會很簡單粗暴的去解決問題(後續可能還是得正規),出奇制勝。也就是說,個人認為,單點爆發的機會,不僅不在「演算法」,也不一定在「有多少數據」,而在解決問題的「思路」

3、發散一點討論,國內語音語義相關的創業型公司,最終可能有3類

1)在垂直領域,把2C產品做成。後面是獨立上市還是被收購,都隨意了。

2)作為平台型AI公司,被大公司收購。

3)作為平台型AI公司,上市。但從Nuance或訊飛的歷程看,會有幾大不利因素。

  • 作為平台,依賴於相關應用場景的成熟度,等待上市需要的年限很長。
  • 一旦相關場景火起來,會被收購邀約;如果沒收購成功,會被挖人!
  • 為了保持優勢,還需要費勁兒的繼續收購其他小公司

總之,語音語義技術,是個人非常感興趣的方向,希望儘快看到真正的突破吧


前面許多童鞋都說的好,作為王冉的粉絲,說下自己的看法:
1、語音識別和語義分析是連接真實與虛擬世界的一道橋樑、他的作用絕不是現在的,和一些莫名其妙的機器人展開對話。而是成為一個更底層的連接技術,這個技術與鍵盤打字,數字版畫畫並無區別,都是在開發一種能連通真實虛擬的標準。這個標準充滿豐富想像力,譬如林海說的最後一公里。
2、然而這種標準,卻絕非打字那麼簡單,他有更深刻的一層含義,就是自然與融入,讓技術更好的為人服務,讓人更輕鬆的融入科技生活,正如這幾天的熱門話題,什麼是「自然」
3、充滿想像力的科技必須依靠人來實現,未來不管專利上會如何確認,短期內可能成為大公司的護城河,但是中長期內,這項技術必定會成為各種應用開發者選擇的條件之一,這是市場化的結果。


語音識別會不錯,但是很難成就大的互聯網公司,更多作為大公司的補充,這個應該是人的生理本能以及物理定律決定的。從信息獲取的角度看,視覺感知的信息遠遠高於語音,從資訊理論角度看,語音也根本沒法承載那麼多信息,所以文字圖片視頻等才是互聯網的主流,語音產生的內容少,語音識別用處也相對小。人機交互上語音用處大點畢竟它是雙向而不是單向(視覺是單向)交互,但是人機交互永遠都是一扇門,進入門的廣大天地才是真正用武之地,語音技術本身難以單獨發展廣大,就像修房子不能只修門一樣。

所以語音本身無法成為主要信息承載體,其信息入口作用也非獨佔性排他性(鍵盤觸摸滑鼠+視覺能很好代替語音功能,更不要說現在的形態姿勢識別),很難再互聯網世界成為獨自主要力量.

補充又看了一下,還有語義識別,這個和語音完全不同,不知道是提問者有意還是無意合在一起說的。語義識別不一定需要語音,比如google分析搜索請求直接給出答案而不是給出某個演算法算出來的網頁,這個就是語義識別。這個方向當然是各大公司重點


這個問題在幾年前就開始很多人討論過了。

人工智慧的演算法是最重要的問題,它必須包含好多個標配的解決方案進去處理。
互聯網的影響?互聯網只是其中很小的一部分,它的衍生超出你的想像:包含移動手機,POS機,航空系統、地鐵、火車、海運等。


技術顛覆只是一個假象,顛覆的從來都是商業利益。


媒介相關的話題,我之前說過:媒介是人的延伸,同時,媒介還是環境的延伸。

無論如何,量化考慮媒介的發展方向,有一個穩定的維度:自由性,媒介的發展就是要給人、環境最高的自由度。

高自由度從用戶的角度看是什麼呢?透明化。

所以,媒介的最高存在是感覺不到它存在。

終端輸入/輸出設備,從文本=&>圖文=&>體感=&>自然語言界面,讓人們越來越不需要藉助其他來實現與機器或人自己的交互。


語音識別和語義分析技術將帶來人機交互方式上的巨大變革。我們習慣於通過鍵鼠操作電腦,通過屏幕觸控手機和平板。然而在不久的將來,我們身邊所有的東西——大到一個房間,小到一支筆一張紙——都可能智能化,語音使我們與這些智能設備的交互成為可能。因此可以說,語音和語義技術使互聯網突破了電腦和手機的邊界,在我們的生活中可以無所不在,無所不聯。而由此帶來的智能產品市場規模,是電腦和手機市場的幾十倍至上百倍,必將誕生無數的科技「神話」。

面對語音語義技術,大小公司會有不同的境遇

1、對於大公司來講,語義平台搭建和演算法實現已經不再是瓶頸了,是砸錢建技術團隊就可以解決的問題,性能做不到90分也能做到80分。真正的瓶頸在於數據,因為語言模型的訓練需要大量的數據,而數據來自於自身的業務。因此商業又回歸到了本質:得數據者得天下

2、對於初創公司來講,語義分析技術本身是一道高高的門檻。雖然一些AI公司(如科大訊飛)已經開放了語義介面,但是只能處理一些簡單常見的問題,對於特定領域或場景下的產品很難滿足用戶需求。如果你用過一些初創公司開發的智能語音產品、聊天機器人的話應該會深有體會。如果自己搭建語義平台,除非創始團隊在NLP領域有深厚的背景,或者拿了一大筆投資請技術大牛加盟,否則是不太現實的。

如果創業者成功跨過了技術門檻,業務上紮根在一個細分領域深入持續挖掘,會形成有獨特價值的數據。在沒有強有力的直接競爭的情況下會脫穎而出,甚至在這個領域中顛覆原有的商業模式。目前在金融和醫療領域裡不乏成功案例。


其實我是這麼感覺的,語音識別對於現在輸入效率的提高,有極大的幫助


對於「siri」我別無他法只能用嘆息來結束!一,這個應用的直接獲益者成為了「信道」,即是說未來的信道不必考慮傳輸文件本身的雜訊,只專註於自身降噪即可。因為音頻基本都以文本的形式有規則的進行傳輸,接收與發送端的聲音除了可以選擇為源聲外,還可以學習成用戶喜歡的聲音播放;二,所有的秘書無論真人、假人都該注意了,以往的優越環境也將受到挑戰了,因為siri的「新穎」、「時尚」、「沒有太多人際關係和管理風險」使得它將會成為未來耀眼的明星秘書;三,Siri技術的和語音控制的區別:Voice Actions提供了非常堅實可靠的聲音識別引擎,它的高識別度令人稱奇。不過,和過去的所有語音命令系統一樣,它要求你說的話要具備嚴格的語法結構和格式,否則系統將無法識別。然而Siri和Voice Actions就有本質的不同了。你可以拋棄繁瑣的語法結構,甚至思維模式也可以混亂,Siri會結合上下文結構去理解,它還會從人類語言史的角度出發,利用人工智慧系統去分析,並在絕大多數情況下領會你的意思。
實際上「siri」對於通信運營商來說也是相對具有威脅的,我記得蘋果公司註冊了一項專利,主要內容是用軟體的方式來模擬數據SIM卡。當這項專利和「siri」相結合後,就會自然的出現這種情況:「siri,請為我配置好網路連接,如果在我使用網路的情況下出現網路信號較弱的情況,請為我自動切換到當下網路信號較強的網路上。」而「siri」就會利用軟體進行虛擬配置,從而實現用戶獲取網路信號的最優化選取。不知道大家是否看過黃易寫的小說《星際浪子》,那裡面對於人類未來的科技幻想描述得十分有前瞻性,而「siri」的出現,也真正說明了人機交互將不再是夢想。人類將通過互聯網路、雲計算、龐大的資料庫和搜索引擎改變自身學習和對宇宙的探索途徑。
一個世紀前電話的出現對於商業型的社會形態的變革衝擊實際上是不可估量的,不僅拉近了人類溝通的距離,還是得信息的傳遞增快了數以億倍,結束了利用落後交通工具傳遞信息的時代。今天,利用人工智慧人類又將向自己未知的世界邁進,也已經可以成為一種進化了,在這個時代,更多的人群將擺脫愚昧無知和各種糾葛,以及更多無效信息的糾纏,用更多的精力和頭腦去開發更加廣袤的空間。


對整個世界信息交流是一次變革,類似於蒸汽機對工業革命的變革,按此發展下去全球任何人與任何人都可以無障礙交流,溝通不成為問題,一切皆有可能
這技術更可能成為大公司屏蔽競爭對手的護城河,資料庫是需要累積的越深厚越.................... 想動手儘早


從這幾年的產品發展趨勢來看,語音技術的發展是科技產品人文化的必然產物。幾年來,蘋果的成功與其產品擁有優秀用戶體驗性不無關係。蘋果將人們由滑鼠解放到手指,進而嘗試由動手解放到動嘴,一切都為了迎合用戶」自然「操作的體驗,讓科技產品變的有人情味。

隨著蘋果的發展,科技人文化理念已經深入人心,因此在這種大時代背景下,語音產品自然會越來越擁有市場,想對應的語義分析,音頻數據挖掘等技術也一定會蓬勃發展。

至於它是否會成為大公司的護城河。我認為這並不重要,試問世界上有渡不過去的護城河嗎?


語音識別要取得突破需要多學科合作,如果哪一天語音識別技術能廣泛實用了,那應該是有一家單位能夠很好滴整合多種學科的技術,如信號處理、心理、計算機、自然語言處理等。這樣一件事不是一般創業者能夠輕易達到的,我認為。大公司或專業公司或高校可能性較大些。


這個真的是個很老的技術,如果只是V to T的話,我記得我在用Delphi5的時候就用過一個IBM做的叫VoiceType的開發套件,當時就已經很成熟了,從七八十年代開始基本沒有脫離過HMM模型。在90年代初的時候ATT就做過類似的東西做自動呼叫(VRCP),大概就是在一定功能下替代人工服務的業務。
這裡真正難的地方是語義識別的部分,很不巧,這部分無論是技術門檻高還是前期投資都是高的嚇人,需要海量的數據和數據處理能力在背後驅動。在現在蘋果、微軟、Google、ATT和IBM一大堆的公司都在做的時候,沒道理創業公司能夠從裡面搶到市場。
另外其實現在對這個功能的是沒有主動需求的,大多是對現有某些功能的完善,例如對輸入需求的擴展,對搜索需求的擴展。無論以後會在手機會在汽車還是會在家裡加上這些智能的語音識別功能,更多的是主要產品的提供商自己供應的,像iOS和Android已經有了,因為這些公司只是靠這個功能改善用戶體驗,對自己現有的基本功能做補充,對於手機公司來說,只是把他們的基礎操作方式除了觸控之外,增加了一種語音控制。另外像Siri出來之後很多人都是短期對其好奇產生的熱度,平時真正很少去用。綜上對現在的互聯網也不會產生太大的影響,只是多了一種輸入方式。
在現有大公司已經做了這麼多年,且投入產出不成正比的情況下,這個產業和創業公司應該是沒什麼關係,談不上有競爭,更不會被創業公司顛覆。但有可能會產生一定的機會,主要集中在:

  1. 可能某些公司會開放他們的語料庫,創業公司可能能夠在冷門領域搶到市場,例如跟教育或者醫療有關的,別的公司還沒有觸及的地方。(NTT應該是做過在金融方便的很多應用,不過不了解具體的方向。)
  2. 可能某些公司會開放api,某些創業公司可以做一些結合的東西,例如在Siri里做一個語音編程的東西之類的。(現在已經有人在越獄的4S上做這些了。)

PS1:據說Android的語音搜索功能是建立在幾年前Google曾經做過打電話搜索的業務,然後記錄下來了每個人的錄音,後來這個業務被停掉了,但是收集了大量的語音信息。
PS2:我見過國內一個很扯淡做Siri中文版的做法,就是把中文語音轉化成英文後用Siri翻譯,然後再翻譯回來。


Siri除了賣萌有什麼真的用處么?
人類尚不習慣和機器對話,在我們的固有概念中,機器是用來「操作」的——這一心理定勢不是科技的發展可以改變的。
短期而言,語音識別和語義分析的主要用途在於在給殘障人士提供更好的控制電腦的方式。


推薦閱讀:

TAG:互聯網 | 創業 | 語音識別 | Siri | 語義分析 | 尋找中國互聯網思想者(活動) |