手機也能錄音,還有必要買錄音筆嗎?


乍看話題感覺博主想問的是「手機可以取代錄音筆嗎?」

這個話題感覺有些似曾相識,似乎在問:「手機拍照能媲美單反嗎?」 但是該話題下大多都是回復一些「別人拍攝的優質作品」,而忽略了在同樣的構圖下,擁有大感測器的單反和手機拍出來的照片有什麼區別。

如果是這樣的話,我先把話題扯遠一點

不知道從什麼時候開始,手機變得無所不能,替代一切。

從純粹的打電話發簡訊到如今的社交娛樂、購物、刷臉支付、IOT,以及「國家力量」介入的eID數字身份證和電子貨幣,手機功能日漸強大,驚嘆科技發展迅速。

直到有一天,有個人讓它飄了,讓不少人出現了常理認知偏差,那個人賦予了手機吊打單反的參數,讓富士等老牌廠商都瑟瑟發抖,用超越PC級散熱的實力,讓酷冷都為之點贊,讓ZOL都驚嘆某款手機與萬元遊戲本對戰毫不遜色,讓用戶為之沸騰。

在如此浮躁的互聯網環境下,作為消費者應該要明白自己的根本需求是什麼,到底想要解決什麼問題,這樣才能購買到最適合自己的產品。

我們回到話題本身「手機為什麼不能替代錄音筆」,或者換個更直接一點的說法:我花了1W+ 買了 iPhone 11 Pro Max 在錄音方面究竟比專業的錄音筆差在哪裡?相信在大多數人認知中,這款手機已經可以代表了目前市面上你能見到的最好的手機錄音設備。

我們先來看手機

全面,你想要的功能幾乎都能找到。其次,以前出門是鑰匙、錢包、手機,現在出門什麼都可以不帶,手機是必帶,所以手機的最大優勢是就是全面和出門必帶屬性。

我們聚焦到錄音上,從iPhone 6s開始,iPhone麥克風增加到了4個,4個麥克風配合可以實現一定的主動降噪能力。在錄音時,這4個麥克風還不是同時工作的…這還只是1W+的iPhone,又多少錢是用在音頻上,用在麥克風上?其它手機品牌又能達到什麼效果呢?

圖片來源@ Referline

DXOMARK Audio測試

在DXO音頻測試中,iPhone 11 Pro Max 錄音也僅68分,這個分數在手機當中並不算好。主要低的分數在力度、空間感、音損和背景上。這還是在實驗室測試的情況下,如果放在生活中使用,效果會更加的糟糕。

在實際使用中,比如在相對安靜的房間里錄個旁白音,也得需要用軟體拉一拉。同時錄製時候也得需要把飛行模式打開,以防來個微信或者電話,這樣的話勢必會有不便捷之處。在聽課、聽講座都需坐在靠前列或者把手機放在講台才能錄清楚。腦暴開會時更恨不能把手機懟到對方臉上,只要你不尷尬,這些都是用手機錄音麻煩的地方。

所以答案很明確,偶爾用,非專業,能忍耐,那麼手機錄音可以滿足你能「錄」的需求。

我們再回到錄音筆

其實早些時候,錄音筆大市場確實處於一種下滑萎靡趨勢,是「存量市場」,傳統錄音筆除了在「存儲空間」上更新以外,再無更多的創新內容能夠觸發已有錄音筆人群的「更新換代」,另一方面非「專業、高頻」需求的用戶被智能手機代替,就是上邊所提到的簡單需求用戶。但是你要知道,錄音筆使用最多的人群是媒體、商務、教育或者是科研工作者、法律領域等,傳統錄音筆行業也一直處在一種基本穩定的發展趨勢,手機對錄音筆行業影響真的沒有想像中的那麼大。

那麼對傳統錄音筆衝擊最大的是什麼呢?

是智能錄音筆的出現,是對錄音筆行業的一次重新定義,一次洗牌。

智能錄音筆都有哪些優勢?

目前智能錄音筆能做的僅有幾家,訊飛、搜狗、飛利浦等。因為這個領域並不像PC那樣,可以從各品牌買來硬體堆上,再刷上一個公版系統就好,而是需要有專業的「語音技術」支持。我這裡以頭部品牌訊飛為例,前不久剛剛發布了新一代錄音旗艦產品SR702。

SR702 有如下特點:

  1. 錄音實時轉文字:據官方數據顯示,聯網情況下轉寫正確率高達98%,離線準確率也達到了95%
  2. OCR文字提取:配備800W像素攝像頭,可拍照提取文檔、PPT、或者圖片中的文字,而且識別準確率也相當不錯,同時還支持視頻錄製自動生成字幕的功能
  3. 旗艦級麥克風配置:2 顆定向+ 6 顆矩陣麥克
  4. 多語種識別:多語種轉寫包含12種方言、8種語言以及2種少數民族語轉寫
  5. 易用的編輯:錄音的同時可以支持標記內容;通過自主研發的空間-時間感知多通道神經網路與傳統信號處理深度結合的降噪演算法(SSA-IME)相結合,在多人交談時,精確區分各個音頻捕捉到目標說話人將內容轉寫並分段呈現;,同時還可過濾一些語氣詞,還有非人聲和無聲片段,方便後期編輯,提升編輯、出稿效率。

以上5點是訊飛SR702的核心優勢,其是獨家首發的離線轉寫功能,可以實現在沒有網路的情況下僅靠設備本身即可完成轉寫,解決用戶在無網路環境下對想要保密信息進行記錄轉寫的痛點。OCR文字提取的加入,也讓錄音筆的功能更加聚合,體驗進一步提升。

在大的會場、或者教室等場景使用,定向麥克風收音就格外重要。定向麥克風一般只有專業錄音筆才會配備,比如售價3999元的索尼 D100。而SR702同樣採用的是旗艦級別配置,2顆直徑10mm的哈曼向麥克最遠收音可達15米,可以說是錄音筆品類中拾音距離最遠的產品,搜狗旗艦錄音筆S1也僅有10米遠。6顆矩陣麥克風主要起到近場收聲的作用,可以清楚記錄不同位置的發聲,降低聲音的重疊。

對於經常外出採訪的記者來說,多語種識別功能相當於身邊跟著精通12種中文方言和8種語言以及少數民族語言的助力,轉寫、溝通都不再是難事。

了解完以上智能錄音筆的功能,每一個點都具有讓你事半功倍的能力。其實還有更多的易用、加分的功能,比如多端同步,編輯、分享等;比如音樂模式,這是很多智能錄音筆所缺失的,因為場景及需求對錄音筆的拾音有著較高的要求比如還原性、採集能力、錄音產生的底噪等;比如在工業設計上,SR702採用了3.5英寸屏幕、3D陶瓷背板設計,很有美感。

買設備送服務,同時購買設備還附送專屬的會員服務,以及3年20GB雲空間服務,這些都是加分項。

科大訊飛AI智能錄音筆SR702終身免費轉寫 中英文邊錄邊京東¥ 3699.00去購買?

我們從新回到話題本身,手機是否可以取代音筆。其實在我看來手機並沒有取代什麼,有的人說手機替代了日曆、手錶、替代了計算器,音樂播放器,真的嗎?手機只不過是讓那些輕度需求,可買可不買的人不用買而已。雖然手機很先進,有很多功能,蠶食了部分輕度市場。但在專業領域,還需要交給專業設備。


我只用過搜狗錄音筆,相比於手機錄音,錄音筆有幾個優點:

  1. 用於多人對話(包括同時發言)的會議環境時,每個人聲非常清晰;錄音筆錄出來的結果很好地過濾了環境音(比如頻繁翻閱材料的聲音),至少這種環境音沒有影響到人聲的清晰度。
  2. 體積小,非常隱蔽;(ps:有些會議會收手機,但是很少會搜身呀
  3. 可自動轉為文字。雖然事後仍需要一定時間來編輯和校對文字,但是仍然比從零開始聽寫一段錄音要方便點;文字識別能力的準確率差不多在80%左右吧。考慮到我用於測試的會議中有位發言者有嚴重口音,我覺得這個準確率還是可以接受的!
  4. 自動翻譯功能,反應很快,可以考慮作為即時翻譯用。當然太專業的辭彙和口音太重的情況翻譯不準。我自己暢想了一下,旅遊用來做個基本翻譯還是可以的。
  5. 容量大,不需要考慮內存的問題。
  6. 不會因為接聽電話而受影響,當然錄音過程中也不會影響你使用其他手機功能。
  7. 覆蓋距離很適中。我參加仲裁庭開庭時,最遠的人大概有5米,錄音中可以清晰地聽到他們的發言。

===========我是更新的分界線========

我注意到這個問題下搜狗自己來做廣告了。。。不過他們推的那個啥S1實在是太難看了!也完全沒有隱蔽性啊!

我買的是好像是C1。這個樣子(從網上找的圖,請無視廣告文字。。。)


一、硬體配置層面:錄音筆相比於手機具有哪些專業的硬體配置?

我作為一名研究生,由於參與導師的看項目,常常需要前往各個地方進行調研。調研的形式多種多樣,比如問卷、訪談、座談等都是比較常見的形式。但人記錄的效率始終是有限的,所以我們往往會藉助外部的工具來提高數據收集,資料整理的效率,錄音筆就是典型的調研生產力工具。

或許有的同學會覺得使用手機錄音就行了,其實不然,由於調研的環境往往差距較大,可以是環境舒適的會議室,也可能是環境嘈雜的田間地頭,很多時候你無法控制錄音的環境變數,只能去主動適應。

手機的錄音麥克風主要是隱藏式設計,原本就是用於通話或者視頻聲音信息的採集,而非專業的錄音工具。所以手機錄音的效果容易受環境的干擾,並且手機錄音的碼率規格比較低(iPhone 甚至都不能設置規格)。錄音效果不佳又會導致復聽難度大,特別是遇到喜歡講方言的採訪對象,那就只能"打猜猜"。

科大訊飛AI智能錄音筆SR702終身免費轉寫京東¥ 3649.00去購買?

而錄音筆則會設計專業的定向麥克風和矩陣麥克風,比如我手上這台訊飛智能錄音筆 SR702 就在頂部設計了 2 顆直徑 10mm 的定向麥克風,正面的中框部分則是 6 顆矩陣麥克風,用於拾取其他方向的人聲。而且訊飛為其加入了 Focus++ 智能降噪技術,根據場景主動識別人聲,同時降低環境音干擾,讓拾音更加清晰。

在錄音距離方面,因為缺乏定向錄音設計,手機錄音往往就跟人耳一樣,離得遠聲音小。而專業的錄音筆,如訊飛 SR702 通過定向麥克風+深度定製的 VoiceCube 聲立方技術,最遠拾音距離達15m,能夠輕鬆應對各種商務場景。

為了方便不同的錄音場景,訊飛 SR702 內置了多種錄音方式,比如會議模式、演講模式、採訪模式、通用模式、備忘模式、音樂模式等。訊飛 SR702 的錄音格式為 AAC / WAV,在碼率方面,音樂模式能到達 48KHz/768kbps,其他模式為 32KHz/512Kbps,而節電模式是 16KHz/256Kbps,儘可能的實現了錄音規格同需求的匹配。

在外觀方面,訊飛 SR702 搭載了一塊 3.5 英寸的 720P 屏幕(445PPI),這在錄音筆中算是豪華配置了。中框機身選用了航空鋁材,錄音筆的背面是 3D 陶瓷背板,觸感溫潤,握持舒適。硬體配置方面,搭載了八核處理器(主頻2.0GHz)、擁有 3GB 內存+ 32GB 快閃記憶體 + 20GB 雲存儲組合(購買附贈三年雲空間),2600mAh息屏狀態下可持續錄音12.5小時,基本上接近一台中檔入門手機的配置了。

訊飛錄音筆的側面分布著按鍵,左側是錄音鍵以及音量+-鍵,右側則是電源鍵和 Nano-Sim 卡插槽(支持 4G 全網通),可以放入 4G 手機卡便於連入 4G 蜂窩網路,也可以接入 2.4GHz 與 5GHz 無線網路,多種網路連接方式能夠保證錄音筆在各種環境中都能接入伺服器,實現準確高效的轉寫。


二、場景體驗層面:好的錄音筆應當具備哪些優異的功能?

第一部分,我們主要聊了手機和錄音筆在專業硬體方面的差異,第二部分我們重點來看看功能方面的差異。

1??【錄音對比】:首先我們來看看錄音對比,我在安靜和嘈雜兩種環境中測試訊飛 SR702 和 iPhone 11 Pro 的錄音效果,朗讀的是《沁園春·長沙》。

在安靜的環境中,iPhone 和 訊飛 SR702 之間的差距並不明顯,無論是頻譜圖還是錄音質量都比較接近。

《沁園春·長沙》(無噪音)Geek研究僧的視頻 · 172 播放

但是我試了下在 85-95dB(A) 的環境中再錄了一遍,首先從頻譜圖上來看,iPhone 11 Pro 已經糊成一片,訊飛 SR702 基本還能看清說話時的輪廓。

從有噪音時的錄音對比視頻可以看出,iPhone 錄音噪音很大,但仍能聽清人聲,訊飛 SR702 聽到的噪音相對少了一些,人聲會更加突出一些。

《沁園春·長沙》(有噪音)Geek研究僧的視頻 · 104 播放

2??【錄音轉寫】:錄音文件只是第一步,接下來需要把錄音文件轉化為可以直接閱讀編輯的文本資料,所以就需要轉寫。過去我們常常是通過人工的方式復聽+轉寫,得益於技術的進步,如今已經可以通過語音識別技術直接將音頻轉化為文本內容。在手機上只能藉助第三方軟體,比如訊飛聽見、搜狗聽寫、有道雲筆記、Noted等等,基本上都屬於付費應用。

而訊飛 SR702 這樣的專業級錄音筆,不僅內置了錄音轉寫這項功能,而且支持實時轉寫,這是什麼概念?等於你可以在錄音時,檢查轉寫的內容與被錄音者想要表達意思是否相符,現聽現改。

想像一下,在課堂里、會議上、訪談中只需要點擊錄音,簡單記錄下主體框架。藉助錄音轉寫就能夠復盤填充出完整的課堂筆記/會議紀要/訪談資料,就問你們厲不厲害。

下面就是一段我口述錄音的轉寫過程,可以看到訊飛智能錄音筆 SR702 在錄音實時轉化為文字時,識別的轉化速度和準確性都相當不錯,而且錄音還具備離線轉寫功能,如果遇到網路信號差的場景或者具有保密需求的場景都可以離線轉寫。

如果沒有來得及聯網轉寫,也可以後台轉寫服務。後台撰寫在錄音上傳雲空間後,24小時內完成轉寫。選擇"加速轉寫",只要在 5-10 分鐘內就能完成轉寫,也可以通過網路分享給其他人。

這款錄音筆也號稱擁有 98% 的錄音轉寫準確率,實際感覺上語速中等,沒有出現人名、發音不標準的情況外基本都是正確,這點和訊飛自己的語音識別技術積累是分不開的。所以我又給訊飛 SR702 加大難度,上了半佛老師的新視頻。可以看到,雖然半佛老師語速太快,訊飛聽成了「半bo」,但總體的內容完整度還是相當不錯,改改拿來當文案足夠了。

然後我還挑了一個視頻,遍數「不知妻美劉強東,悔創阿里傑克馬,一無所有王健林」,總體來看,王總的發音比較難辨識,小馬哥和強東哥的錄音區分度都相當的高。

至於文本內容與發言人的各自對應關係,這還涉及到一個區分的功能,所以訊飛智能錄音筆 SR702 加入了對錄音語義自動分段,還能夠規整口語、過濾非人聲、標記書籤,甚至區分講話人,篩選重點內容,這樣就不怕遺失重要領導的講話內容了。

不過因為實際錄音中會有吵雜的背景噪音,並且人聲之間會有相近之處,還是會存在串台詞的情況,在錄音筆中只能對系統區分的講話人進行統一命名,而不能單獨命名。導出的轉寫內容也沒有像錄音筆端那樣區分了說話人,我覺得這是訊飛後續可以考慮強化的體驗部分。

此外,訊飛 SR702 還提供了外語、方言以及專業領域轉寫的功能,之前我和老師去一個縣級市調研,領導們操著一口當地的方言,當面都要猜他們講的什麼內容,更別說後面復聽錄音了,簡直就是噩夢級的轉寫體驗。現在有了訊飛 SR702,我覺得就不用怕之前那種情況了。

3??【OCR對比】:OCR 功能也是相當重要的生產力功能,對於學生黨和行政工作人員而言幫助頗大。比如你看到一段無法複製的文獻/書籍/手寫稿時,就可以通過 OCR 功能把它拍下來轉換成文字內容,不用如過去一般,一個字一個字的敲。

手機的 OCR 功能同樣需要藉助第三方 APP,諸如掃描全能王,而訊飛 SR702 則是把 OCR 功能集成在菜單中,通過一顆 800 萬像素數字變焦攝像頭+閃光燈,可以有效的拍攝文本內容,便於提高識別精度。

從對比的效果來看,訊飛 SR702 和掃描全能王相比,在中文的識別上不相伯仲,但掃描全能王的英文內容還加入了空格,訊飛錄音筆卻忽略了,我覺得這是後期需要重點改進的方向。

5??【其他功能】:訊飛智能錄音筆還有一項看起來非常厲害的功能,就是中英互譯。SR702 結合訊飛TTS語音合成技術,可以通過邊錄邊譯的方式實現中英互譯。比較遺憾的是在翻譯完成後,不能將內容通過語音合成的方式發音出來。

雖然不能播放語音,但文本的形式對於英語學習者也很有幫助,比如我在刷生肉時,就可以用訊飛SR702 輔助,如果遇到聽不懂的內容,就用它翻譯一段,提升理解。

此外,訊飛SR702 還具備語音助手功能,可以通過語音開關錄音,並能夠選擇錄音的模式等,不過我感覺存在感不強,還是那個雙擊側面按鍵開始錄音的模式比較高效一些。


三、如何評價訊飛智能錄音筆 SR702 的使用體驗?

經過本文的對比展示後,相信大家已經對手機和錄音筆之間的差距有了一個清晰的認知,首先是在硬體層面,手機只能藉助隱藏式的麥克風來簡單錄音,訊飛 SR702 則擁有專業級的錄音麥克風硬體+訊飛智能錄音演算法,可以更加準確高效地滿足專業化錄音需求,並且能夠消除手機無法處理的環境噪音以及遠距離錄音場景。

除了錄音的專業性差距外,在功能性方面,手機需要藉助第三方付費 APP 才能夠實現錄音轉寫、OCR、邊錄邊譯等,而且在準確性上也參差不齊,取決於軟體供應商的水平,並且軟體與軟體之間沒有打通。訊飛作為軟體出身的品牌,通過 SR702 錄音筆進一步打通了功能之間的壁壘,實現了錄音信息的最大化整合和利用。這是手機所無法企及的,只能期待專業級的第三方 APP 同手機深度定製才能達到這種效果,然而目前尚未見到系統級的應用出現。

訊飛 SR702 已經擁有了很高的集成度,所以專業的事情還是交給專業的工具來完成。並且目前訊飛為用戶提供了專屬會員(終身免費轉寫、翻譯等),激活之日起,還贈送 3 年 20GB 雲空間服務,基本上屬於一步到位,沒有太多額外的開銷,省心省事,這點是我非常看重的。這些年學習我也沒有少買那些電子詞典一類的輔助工具,基本上都是硬體成本+軟體付費的套路,用的讓人心累。

當然訊飛 SR702 也有幾點值得改進,首先是是錄音筆實時轉寫功能目前還不能直接保存,只能作為觀看輔助,希望在後續能夠加入保存功能。其次是錄音轉寫的文本信息目前不能直接在錄音筆中編輯,需要後期的處理,這對於資料整理多了一項導出的步驟,多人錄音的區分度和可編輯性上也有待加強,希望它能夠直接對文本內容進行編輯,打通從錄音到文本的最後一公里。

分享到此結束,感謝您的耐心觀看,我是Geek研究僧,一枚愛好評測的研究生。


我覺得錄音筆單獨存在的原因主要有2個:

1.手機硬體方面不是專門為了錄音設計

比如:手機自帶的麥克風錄音效果達不到要求

索尼的有兩個麥克風,每個和拇指差不多大小;手機麥克風估計只有索尼錄音筆麥克風的1/20大小,他們的收音效果能一樣么?

比如:專業的電路設計帶來更高的信噪比

做個簡單的比喻,手機就好比磁帶,再怎麼搞也無法突破磁帶效果的極限,錄音筆好比CD,在設計上(原理上)天生就比磁帶音質好。

2.軟體方面,錄音也需要很多專業功能

比如:更好、更高碼率的錄音格式支持

比如:專業濾波器、限幅器

比如:高品質的降低環境噪音、突顯人聲等專業演算法


用過科大訊飛的999和1999款錄音筆,2019年9月購買,大小會議有10幾場,主要應用場景就是轉寫(主要吐槽轉寫)

先說優點:

1.如果是日常場景對話,沒有嗯嗯啊啊什麼的,感覺準確率能有95%,可這場景太少了,基本都是開會用。

2.行業會議,看轉寫結果能回憶個大概其實還是蠻有價值。實際上準確率80應該是有的,直接用肯定不行,實際體驗不佳,差10%以上會對理解產生不小影響,在使用過程中如工控,it系統辭彙大半識別不對,對於外行來講,現場聽都似是而非,看轉寫的結果就是災難性的,可用性低。如果你本身很懂,連猜帶看那價值就高不少。

3.看了下文的高贊回答,律師行業應該比較適用,畢竟都是日常會話居多。如果是大數據,工控領域就慘了。

缺點:

1.神奇的電量:有兩次要開會發現不能開機了,周四用1次(滿電到94),關機狀態下,下周四再用就無法開機了,電量0,以前以為是誤操作,試了2次都這樣,換了1999的機器系統也升級基本沒改善。錄音本身不費電,但關機過夜很費電...

2. 準確性:it類,工業類會議,再加上2,3個發言人,結果可用性低,需要大量的人為修正,有時還不如自己手動方便。

3.轉寫效率:標稱1小時錄音5分鐘,但這東西上傳雲後沒準,快的時候20分鐘半小時,慢的時候上午的會,晚上下班到家還沒出結果,不過一般當天都能出(登錄帳號後下載word版本)。不知道現在有沒有改善。(這條不算缺點)

4. pc端登錄,我記得有個邊聽邊改的頁面,對照錄音位置和文字,結果就是一個退格鍵能毀所有。簡直反人類,希望現在改進了。

4. 費用:買機器送1年的轉寫免費,不知道現在的活動,付費轉寫20分鐘8塊的樣子,一次費用30+。不會再用,結果不可用還收費不便宜。

5. 會員期間,非錄音筆錄音,外部上傳錄音撰寫收費,(如果有方法,歡迎指正)

6.錄音質量:都是在會議室錄音,錄音外放後沒覺得比水果手機有明顯的差別。實發場景:10人桌的會議室,發言人聲音小,錄音筆在對角一樣無法轉寫。(耳朵能識別小聲的錄音筆不行)

==================

補充:

用它開了10個會+吧,大概有點發言權,

隱蔽性不提了,肯定不如手機+飛行。999的可以放在襯衫口袋,1999的大了一截襯衣口袋放不下。

行業會議,如果是業內人士,看轉寫結果能回憶個大概其實還是蠻有價值的(注意word動輒20-30頁的無腦分段也很蛋疼,但絕對比聽90分鐘的錄音效率高很多)。

剛京東看了下,現在買機器,應該是終生免費機器轉寫了。

附在用設備圖一張

1999元款


推薦閱讀:

Sterling 推出新款電容麥克風套件
賈爽:三千元左右網路K歌直播錄音音效卡電容麥監聽耳機搭配推薦
你想要自己錄音嗎?窮人也可以!
cubase 9.5 AI版錄音有聲音 無波紋解決方案

TAG:錄音 | 錄音筆 | 錄音設備 | 錄音軟體 | 通話錄音 |