從聊耳機頻響到談EQ補償，聊聊未來的耳機的發展趨勢，從此改變你對耳機的認知

06-03

來自專欄 HIFI老司機

Hello！大家好！歡迎收看hifi老司機最新一期內容，抱歉新一期跳票跳了那麼久，其實也是為了秉承嚴謹思考的前提，之前由於各種原因決定斷更半年時間，就是為了研究清楚該如何的客觀、嚴謹的評價一個音頻設備的聲音，作為未來大計劃的一個前要，這一期是希望能讓許多HIFI發燒友重新認識聲音的本質，能夠重新看待耳機這個事物，出於內容具有相當複雜性，極其硬核的原因，這一期打算不做或者推遲視頻版。

（圖片資料如有侵權請聯繫刪除）

許多hifi發燒友在入燒時都聽說過耳機和音箱的頻率響應這件事，也很可能思考過什麼樣的頻率響應是好的,但是對此方面的認知也是一竅不通，不知道頻率響應能決定什麼東西，那麼今天，我們就來好好談談頻率響應決定了什麼。

我們先來認識聲音是怎麼構成的

聲音的三大要素分別為頻率、響度、音色，這是最基礎的構成

那麼頻率影響什麼呢？比如說我們擊響一台鋼琴a4鍵的聲音，這個發聲體的整體振動的最低頻率產生的就是基音，比如說這個基音是440hz，頻率的高低直接構成了他的音高，而其餘部分聽起來像嗡聲之類的部分振動產物也就是諧波，俗稱泛音，其中諧波還有分段振動的組成部分，也就是多次諧波，基音和諧波的複合音最終構成了基本音色特徵，而響度簡單點說就是指聲波振幅高低的體現形式,也就是聲壓、聲音大小的體現。

鋼琴440hz基音及其聯帶泛音

基音與諧波複合構成複合音，也就是音色的基礎體現

那麼另一個影響音色的要素——相位是什麼呢？

簡單點說，相位差的體現就是不同頻率的聲波到達時間的相對關係，這將最終影響聲音空間感的重現，理想的相位差是人耳可聽頻域內，全頻接近於0°誤差的。

而另一方面，多數多揚聲器系統並不是最小相位系統，但多數單揚聲器系統是最小相位系統，最小相位指振幅響應和相位響應之間的關係可以相互預測，振幅響應的改變會帶來相位響應的改變，不同頻率下相位差影響了頻率的振幅高低趨勢（因此不要看最小相位曲線來判斷耳機的相位差，那不是實際的聲音相位差，對於最小相位系統來說，頻響平直即最小相位平直，另一方面解釋這個是因為和我們後面將會用到的最小相位EQ有關係），這種聲壓、相位、頻率的相關聯變化關係就是頻率響應。

也正因為如此，我們看一個耳機或者音箱系統的好與壞，首先需要關注的就是頻率響應這件事情，頻率響應直接決定了回放音色的正確與否。構成如今這個複雜的音樂器材發燒世界的因素，正是因為人的聽覺系統是個複雜的系統，而大部分發燒友又缺乏客觀的認識，但這並不能阻止我們追求客觀準確的道路，我們接下來繼續剖析。

先了解音樂製作，才能了解回放工程

我們先考慮幾個因素，首先，音樂是在什麼樣的環境里進行製作的？

如果我們仔細思考我們用耳機聽的內容，也就是大部分我們聽的音樂作品一般都是在錄音棚里基於立體聲音箱系統的製作成品，而這個製作音樂的監聽環境的聲場構成是近似於混響場的，無論你聽的是古典樂還是流行音樂還是金屬搖滾ACG通通都是在這種環境中最終製作而成的。

那麼，怎麼理解聲場這個概念呢？

傳播媒質中有聲波存在的區域叫聲場（不是那種用文學描述那種聲場）

先說說自由場，在自由場中聲波在任何方向無反射，聲場各點接受的聲音，僅有來自聲源的直達聲而無反射聲。測試音箱指標通常所採用的環境就是地板懸空的自由場消音室，這樣可以消除各個方向的反射聲干擾以獲得準確的干聲信息，而開闊的曠野，只要周圍較大範圍內無反射物，也可以近似為自由場。

自由場

而錄音棚多數是處在一個四周接近封閉的環境，一定程度上接近於擴散場的概念，擴散場是指聲波能量密度均勻，在各個傳播方向作無規分布的聲場。從聲波的能量密度的角度來說，聲場內各處的平均能量密度是相同的，這個均勻的聲場稱為擴散場，理想的擴散場是難以實現的。

錄音棚並非是嚴格意義上的規整封閉空間，仍有相當一部分聲波會被牆壁、地板、天花板、吸音材料等吸收然後再反射，聽音位各平均處的聲壓能量密度並不完全相同，並不能無衰減的折射，所以會帶一定的自由場特性，我們把這個聲場的特徵稱為混響場，而且錄音棚的聲學處理上為了在聽到更接近錄音本質上的聲音同時不偏離普通人聽音環境太多，高端的錄音棚通常會把混響時間控制到約0.4s-0.5s左右，將反射信號壓得儘可能的低。

混響場

也就是實際上我們聽音箱聽到的是整個室內響應，而並非是單獨的音箱聲音構成成分，這也是為什麼很多人說燒箱子也是同時在燒房間，因為房間就是音箱系統的另一半構成，越大的房間容積可以獲得越小的混響時間。而大多數人的箱子系統由於缺乏處理校準是做不到這麼優秀的，會有接近1秒甚至以上的混響時間，聲音沒那麼「干」，然而，通常情況下，混響時間越短，聲學舒適度越高，這是因為過長的混響時間會污染掉錄音本身的混響信息，就不HIFI了。

所謂精確、低失真的回放就是精確回放錄音本身，回放這環永遠和現場搭不上關係，你比如說聽一個單聲道錄音，無論怎麼弄回放，他都應該是單聲道的信息，因為你聽的是錄音，不是現場，錄音從開始聲音錄進麥克風的那一刻就不再屬於現場，現場的參考意義，是僅對於音樂製作而言的，對回放工程沒有任何意義，回放是屬於獨立的系統構成

說完聲場後，回到主線，那麼這就涉及到一個問題了，人聽音箱的最終響應曲線是怎麼測得的呢？音箱為了保證儘可能降低相位抵消和反射聲之類的問題，夾角一般是標準的60°水平夾角，離聽音點距離大於1米，具體監聽距離參考音箱的推薦聽音距離，那麼我們排除掉其他因素的影響，使用1/4寸麥克風等手段，測量聽音位的音箱頻響並進行DSP修正拉到平直，我們現在就只需要知道最終耳膜處測得的最終頻響是大概什麼走向趨勢的，不管是利用模擬人頭，還是實際的人深入耳道埋置麥克風，就可以知道我們耳機需要做到大概什麼樣的趨勢才能保證音色回放接近於理想平直頻響的音箱系統。

於是乎，我們就會得到一條近似這樣的曲線，而之所以只能說是近似是因為現代測量設備的精確度以及音箱布置的環境差異性的問題會造成一定的偏差，但是我們考慮大體趨勢就足矣，不必細究牛角尖，總之這意味著只要偏離這條曲線非常多的耳機，就會出現不同程度上的音色失真問題。

平直頻響音箱在混響場中最終到達鼓膜的頻響

另一方面，我們到底是想讓耳機重放什麼樣的音箱室內響應？首先，不可否認最接近理想客觀準確的是擴散場，因為聲場是均勻的，這意味著重放準確性將會達到理想的水平，入耳式耳機也有條件可以模擬這點，將會是徹徹底底的「干聲」，不一定討好人。

如果是基於混響場則會更接近大部分錄音棚和專業聽音間的感知，而像哈曼卡頓也提出了他們自己研究的理想耳機頻響曲線，是通過經過一定聲學處理的HIFI聽音環境下平直頻響的HIFI音箱測得的人頭響應曲線，並且經過大規模的測試研究，以多數人的聽音喜好做了平均修正，相比之下有相對稍低的高頻和稍多的低頻，這意味著會重放會更接近HIFI音箱的室內響應。

綠線為平直頻響音箱測量值，黑線為喜好評估值，藍色為研究多數人喜好後的優化值

而像發明了入耳耳機及推出過傳奇耳塞ER4的公司——音特美也根據自己對人聽覺系統的研究設定了自己特有的目標頻響曲線標準，由於模擬的室內響應特性不同，所以不同的款式頻響還是有一點偏差，但是總體趨勢一致。

我們所持有的音特美產品各種情況下的頻響測量數據，看個趨勢就好

即便如此，這幾種經過研究得出的頻響曲線標準，也沒有偏離實際太多，依舊尊重了基本的音色客觀事實，而差異構成只是模擬不同的室內響應特性而已，這時候如果你回頭看看市面上許多耳機的頻率響應標定，那是真的都比較亂，大部分根本沒有做到貼近，有些偏離甚至是極大的，常見的問題是沒有足夠高度的3khz峰或者超量的中低頻凸起或高頻峰或高頻塌陷，總之就是問題大雜燴，這類耳機根本沒法被稱為HIFI耳機。

（有機會大家可以自己去搜搜看各種海外網站測量的耳機頻響，這裡就不一一放出，我們以後官網木耳網woodenears.com上線後也會放上大量的測試數據以供參考）

HIFI的前提是首先要人耳可聽範圍內感知上是平直頻響，而音質好的前提必要條件首先就是要比較准，否則都跑偏了你還是聽到錄音本身的真實信息反映么？

就算再高昂的價格、再高端的定位、有再低的非線性失真特性也無法改變頻響失准聽覺上明顯失真的事實，這是聽覺上的第一道失真，也是目前耳機上普遍存在的，最嚴重的失真特徵，遠大於其他非線性失真的影響（還不服的話，就拿著你拿著這類耳機，找個室內響應良好、平直頻響的箱子系統AB一下就知道偏到哪裡去了），人通常能一下子直接判斷的非線性失真通常是超過1%的，而對於0.1%以內的感知越來越困難，而相對來說，頻響不理想帶來的聽感失真是通常遠超過1%的。

當我們談論到非線性失真，比如說諧波失真的時候，它只是單純指輸出信號比輸入信號多出的諧波成分，這實際並不能直接代換你聽到的第一環音色失真，這是因為耳機相比音箱隔離了絕大部分人上半身的影響。

更何況大部分聲音的音色構成元素就是大量的泛音成分，疊加上回放設備的諧波失真，只要本身問題不嚴重，想分辨多出來的諧波成分本身就不容易，人類判斷失真的能力相當的有限，這也是有損壓縮音頻可以利用心理聲學進行開發的一個可行因素。

人聽耳機、音箱，首先會察覺到的音色失真是頻率響應的不理想、感知不平直導致的聽感偏差，然後才是諧波失真、互調失真、相位失真之類的非線性失真以及殘響時間構成的問題。

至於頻響失准帶來的影響到底有多嚴重？我們現在做幾個實驗來驗證。

我們現在來做一個很簡單的演示，我這裡有一條奧蒂茲LCDi4，他的原始頻率響應曲線是這樣的，非常不理想。

LCDi4原始頻響

LCDi4+擴散場HRTF補償反向觀察

我將LCDi4的原始頻響換算成對錄音回放造成影響的聽感曲線（相當於你在聽這麼一個室內響應特徵的音箱）以及加上將他EQ拉平的頻響進行人頭錄音進行聽感對比，聽完你就明白為什麼你看耳機第一件事就必須是關注這個頻率響應特徵是否科學合理。

鏈接: https://pan.baidu.com/s/1Gd2v6mOFz8W6USD9qhb4vQ 密碼: 7yhi

接下來我們要做的一件更加違反常識的事情，就是我們把009、LCDi4、ER4P、ER4XR、IE80、Urbeats這6條耳機，通過測量曲線，並通過EQ APO拉平頻響後，通過BK 4128及RME FireFace UCX音頻介面錄製，請你分辨誰是誰，1-6音頻+一個原曲，你試下區分出誰是誰，我們會在文章最末公布結果。

鏈接: https://pan.baidu.com/s/19LXPW23Bv7lZw2nJMNgGNw 密碼3R6E

聽完後，我相信大家大概也能明白耳機雲試聽的無意義了，如果我不拉平頻響，你基本只能聽出耳機原始頻率響應的均衡器效應再疊加上耳機或者音箱上的原始頻響，帶來大量的音色失真差異，如果拉平了，實質素質難區分困難，這是因為頻響對聲音的影響佔據了70%以上，如果對比音樂原檔，大部分人只能聽出一點點差異和相比原錄音的信息量下降，而不知所以然（沒錯，造成信息量比起原錄音下降的原因就是因為耳機的各種非線性失真、信噪比損失、測量誤差等累積導致的，你拿音頻介面自己loop自己，錄出來的效果幾乎可以打爆任何耳機拉平的波形準確度，而所謂終極理想的耳機的失真性能，就是拉平頻響後，錄下來的波形和錄音原波形一模一樣），動鐵聲，靜電聲、動圈聲之類的根本不是你想像中的一回事，你受的耳機原始頻響以及CSD累計頻譜衰減圖(瀑布圖)帶來的影響，相比耳機本身的非線性失真造成的感知偏差要多得多，像頭戴之所以聽起來不像耳塞也是因為CSD的特徵有極大的差異，類似於在不同的房間里聽箱子的室內響應，其實並沒有頭戴就一定更好的說法，假如說某些著名頭戴相當於一個聲學處理上低頻吸收很一般的房間里聽音箱呢？而且優秀的頭戴耳機頻響確實絕大部分做得比耳塞更接近理想的Target，你聽起來比那些亂做頻響的耳塞好是絲毫不稀奇的。因此，正確、客觀的評價一款耳機，並不是那麼簡單的一件事情，你有太多東西需要認真考慮的，而不是一聽就拿筆去寫，無靠譜的測量數據輔佐的個人聽感文基本就是一人一說法的東西，你根本都不知道你聽進耳朵里的是什麼東西，那麼如何排除掉你的個人主觀感知以避免影響結論的準確性？假如說你本身就極其喜好很多的低頻呢？那麼這個突出的低頻量感，你認為是平直的，而實際上原錄音即便加上錄音棚的室內響應也沒有那麼多低頻信息，這不就是一種失真的體現？

說到這裡，就不得不提我們現在所在做的耳機EQ補償計划了，這個項目的目的就是為了讓一部分失真條件不算太差然而頻率響應不理想的耳機有機會趨近客觀上理想頻響回饋，類似isine20、LCDi4這種失真低，頻響不理想的耳機，就可以實現非常的好的效果（就奧蒂茲官方isine20的lighting線其實就是內置了一套預設的EQ校正頻響）

LCDi4+擴散場HRTF補償對比原始頻響

那麼我們又是如何去實現這一點的呢?首先，通過前面的結論，打個比方，我們現在給LCDi4測試頻響，我們會得出一條頻響曲線，那麼我們導入目標曲線補償我們測得的原始曲線，就可以得出他的頻率響應差異值。

我們將這個差異值導入到類似EQ APO這樣的最小相位EQ軟體里，反向調轉就可以實現補償的目的。

那麼除去PC，其他設備又如何實現呢？我們只需要一個有脈衝響應校正功能的播放器或者插件就可以實現，其實實現的原理都是相近的，我們可以將曲線的CSV文件通過類似HOLMimpluse這樣的軟體轉換成脈衝響應文件就可以用來做校準，因為脈衝響應簡單形容就是頻響+相位的結合，安卓平台上的ViperFX，MAC平台上的jriver、Amarra4、hqplayer等，這些都支持脈衝響應載入，像fiio的安卓用戶因為新版系統內置了ViperFX，直接就能用上EQ補償了，這個功能的道理就很類似今天專業音箱普遍在做的DSP補償，一些物理條件上難以滿足的一些細緻末梢，可以通過科學的測量手段結合相應的軟硬體來解決問題。

也許你會問了，EQ調節不是會帶來失真嗎？按照一般舊有的觀點。

回到一開始，我們談論過大部分單單元耳機都是最小相位系統，那麼我們通過改變耳機的最小相位響應，進而修正振幅響應，實際上是可行手段（這也意味著相位差問題較大的多單元系統沒法通過EQ補救出正常的聲音，因為不同頻段的到達時間不同，或者說就算可以補救也是非常困難艱辛的）。

而且，我們實測補償後其帶來的失真，遠小於回放系統各處失真總和，個別情況下，有些指標上的失真比起原來甚至還能降低，比如說我們壓低了頻響上的某個突出過分的諧振峰或者殘響峰，就會相應的降低聽感上的失真峰，因此低失真的EQ這件事其實是可以接受的，而且耳機7khz後的頻響和人的聽感如果想要平直的match起來，這恰好就需要一個超低失真影響的EQ介入輔助。

再說了，DSP補償手段應用於專業音頻廠商，例如真力SAM、Sonarworks等，歷史已經非常悠久了，如果合情合理的配置補償，還會帶來可聞的失真，那還有什麼可用性呢？

我們做耳機頻率響應補償，不是為了修正耳機短板，而是為了讓其獲得更加正確的響應，並且利用EQ這個工具用於耳機指標測試及聽感批判性對照，這個初衷目的必須要明確。

頻率響應補償這件事情，有相當意義上的專業性要求，不建議玩家自己隨著聽感隨意操作。具體用法我會隨後更新在知乎專欄及未來的官網中，另外，我們的官方網站木耳網 woodenears.com目前也在建設之中，暫未開放，不久的將來將會上線，以方便大家今後的瀏覽觀看，我們將會建立起國內第一家有大量嚴謹的失真測試數據的耳機評測網站，同時也會量力而為的提供一部分耳機的補償EQ文件。

說到這，我們再次回到標題，為什麼我會說未來耳機是屬於DSP的呢？一個很重要的原因就是耳機是無法直接通過傳統的物理形式獲得更加貼近人正常的聽音方式的，而通過物理結構調音、相位失真等的手段則會造成不同程度的失真問題。

耳機因為缺失正常的HRTF函數影響，是沒法不做任何處理就能直接還原出正確到足夠欺騙人的聲場的，沒有任何的可能性。但是，正因為我們相信世間萬物是可量化的，我們只是需要的是科學的認知、準確的測量和合適的手段。

今天我們的初步目標是讓一部分頻響不理想的耳機發出他本該發出的聲音，下一步我們的目標就是將人聽立體聲音箱系統的互饋模擬做到成功，這也是我們採購BK 4128人頭軀幹模擬器以及BK 4195人工耳設備的目的之一，我們甚至計劃未來採購APX555音頻分析測試儀以及最新款的BK 5128高頻人頭軀幹模擬器以輔助實現更精確的數據測量。

耳機如果只是模擬立體聲音箱系統的聲場感知的話，不需要考慮人上半身動來動去的HRTF差別，相對容易實現很多，再遙遠的話，耳機就是走向模擬HRTF的道路，這將會給與耳機從另一個層面徹底的超越音箱的可能性，音箱的聲場還原再厲害也做不到可以欺騙你腳底下有顆小石子掉落或者是水從頭頂淋下來之類的聲音感知，但是耳機可以卻通過模擬模擬做得到，也許這需要客制化的個人HRTF函數測量，也許早期實現代價非常昂貴，也或許總有一天你拿著手機、相機拍幾張照片也能實現粗略的HRTF函數估算，你要永遠記得，人只有兩個耳朵，哪怕今天的音箱系統也只是某種妥協手段，因為音箱也有著屬於他的相位失真特性，雖然音箱體感也是耳機無法擁有的。

我們所預測未來的先進做法是，耳機本身做到人耳可聽範圍內近似全平的頻響及最小相位，然後儘可能低的各種失真指標，良好的頻譜衰減特性，然後通過dsp實現成發燒友夢想中的超級耳機，只為了讓他有能力模擬成理想聲場中的平直頻響音箱。我敢跟各位打賭，十有八九會很類似音特美ER4這樣的深入耳或者精確配對頻響的定製耳機再加上DSP，演算法拯救世界。

我們不期望所有玩家能願意接受這種更加科學客觀的指導觀點，但我還是希望能有一批新一代的真正意義上追求HIFI的發燒友能夠站出來，對業界產生一次有力的思潮，科學才是HIFI發燒這個圈層獲得新一輪進步的可能性保證，雖說每個人聲音感知都是獨一無二的，但是也是可以通過這種機會獲得屬於自己的，直觸錄音本質可能，實現真·HIFI的理想。

你只要稍加學習，有正確的認知，就並不再需要無腦的玩HIFI耳機，這是我們HIFI老司機的願景

歡迎加入官方QQ群637566133交流，我們下期再會。

（禁止刷黑歷史梗）

盲聽結果：Beats 1 Er4xr 2 Ie80 3 Lcdi4 4 Er4p 5 009 6