近日看到多篇關於音響的文章, 內容大致上都是說: 48kHz最高可以錄取24kHz的聲音, 24kHz包含了人所能聽到的範圍, 因此, 取樣率再高人也分辨不到. 怎麼人們老是認為48kHz取樣率可以錄得人們聽到的所有聲音?
雖說以48kHz的取樣率理論上的確可以還原出24kHz的聲波, 然而, 那並不表示那就足以錄取人們聽到的所有聲音. 不知道他們到底是把PCM取樣看得太完美, 還是完全不知道PCM取樣的缺點? 也許他們是把過去教科書中說20kHz的聽覺上限混淆了.
怎麼那麼多人都在說48kHz取樣率可以錄得人們聽到的所有聲音...
版主: DearHoney
我提出的問題就在這裡. 以正弦波測試的話, 這的確是事實. 可是, 那是低估了人的聽覺.JamesT 寫:假若人確實只能聽到 20kHz, 那麼 48kHz 取樣就確實可以記錄下全部人所能聽到的聲音訊號... 這是無庸置疑的吧...
讀生物科的人應該知道, 耳蝸對不同頻率都有反應. 讀人工智能的人, 也該知道人腦極大規模並行運算的能力. 另外的一些醫學研究說明人接收的數據比我們想像中大量很多, 大腦會作適量簡化才可進行處理. 簡化及分析能力因人而異, 而且有部分是可以透過學習改變的. 有人天生缺少了簡化資訊的能力, 成為了罕有的超級天才: 有人在彈奏鋼琴就有驚人的才華, 任何陌生的樂曲只聽一遍就可完美地彈奏, 可是那人卻有語言障礙. 有人只要坐直昇機在倫敦上空看數秒鐘, 之後就可像拍照般把整個城市都繪畫出來, 可是那人卻有閱讀障礙.
人聽聲音時收集到的, 即使經過了簡化, 也肯定不如48kHz PCM取樣那麼少. 也沒有那種時脈引起的明顯取樣位置問題. 舉一例子, 我們的聽覺不會因為時脈關係, 令取樣位置落在不理想的位置, 使整體波形的水平得不到正確的量度.
另外, 從超級天才的醫學研究可以知道, 人的感觀系統可以有多厲害. 配合適當的訓練及學習, 我們的能力往往有很大的上升空間. 你會分辨FM跟CD嗎? 你會分辨MP3跟CD嗎? 你會分辨同一套CD機在不同耳機或喇叭上播放的品質嗎? 你會分辨同一套耳機或喇叭配不同上CD機播放的品質嗎? 你會分辨相同音效晶片在配不同PCB時播放CD有沒有分別嗎? 做到愈高層次, 是因為耳蝸發達了嗎? 不, 那是我們在簡化資訊上改變了.
回到根本的問題, 不少人就是相信了那個正弦波聆聽測試的極限, 同時又高估了PCM取樣的能力, 而否定了聽覺有更大的潛能, 也因此沒有再探究下去.
如果說 48khz 和更高的 sample rate 有聽覺上的分別, 而又要提出證據的話, 那應該是時間反應上的分別...
從站上的 RMAA 資料庫來看, DAC 會把 44.1khz 取樣的聲音在 20khz 左右給濾掉, 48khz 取樣的聲音則會在 22khz 左右給濾掉, 這種 filter 會造成時間性的影響, 比如說原本只是一個 sample 有反應, 但 filter 過後就會影響一大堆 sample
在數位的環境下 src 都會造成類似的影響
如果造一條 square wave 然後播放的話, 在播放完畢後我會聽到「餘震」, 但我不能確定那是 sample 位置的問題還是我的耳機/喇叭的問題, 因為我只是在用一些爛器材
但平時聽音樂的話不會有這種感覺
不過小弟認為強調一兩個 sample 的位置的是沒有大作用的, 我們聽音樂是一個個片段去聽, 起碼十多 ms (這只是個人推斷, 而且也要視乎音樂類型) 的 sample 加起上來才有聽覺上的意義, 比如說我們看圖也是看紋理, 看物件, 而不是一個一個 pixel 去看吧?
參考資料
http://www.pcavtech.com/techtalk/upsample/index.htm
http://www.dcsltd.co.uk/papers/aes97ny.pdf
從站上的 RMAA 資料庫來看, DAC 會把 44.1khz 取樣的聲音在 20khz 左右給濾掉, 48khz 取樣的聲音則會在 22khz 左右給濾掉, 這種 filter 會造成時間性的影響, 比如說原本只是一個 sample 有反應, 但 filter 過後就會影響一大堆 sample
在數位的環境下 src 都會造成類似的影響
如果造一條 square wave 然後播放的話, 在播放完畢後我會聽到「餘震」, 但我不能確定那是 sample 位置的問題還是我的耳機/喇叭的問題, 因為我只是在用一些爛器材
但平時聽音樂的話不會有這種感覺
不過小弟認為強調一兩個 sample 的位置的是沒有大作用的, 我們聽音樂是一個個片段去聽, 起碼十多 ms (這只是個人推斷, 而且也要視乎音樂類型) 的 sample 加起上來才有聽覺上的意義, 比如說我們看圖也是看紋理, 看物件, 而不是一個一個 pixel 去看吧?
參考資料
http://www.pcavtech.com/techtalk/upsample/index.htm
http://www.dcsltd.co.uk/papers/aes97ny.pdf
不要看到"超級天才", 就以為那是特例. 你真的瞭解我舉出這例子的真正意義麼? 我這樣說絕不表示音響應當針對"超級天才"來製作. 那些"超級天才"的例子, 說明了眼及耳收集回來的訊息比我們想像的都要多, 我們的腦袋才是真正的限制所在.小酒蟲 寫:舉一些少數超級天才特例來佐證,會不會太偏頗了些?
人不是機器,所以每個人能聽(感受)到的程度不同,而在工業上本來就不可能為了一些特例而去做無限上綱的機器出來。
我不是說大家要變成"超級天才"才可欣賞到音樂的細節. 只是想大家知道, 不能與不懂得是兩回事. 事實上, 我們腦袋如何處理聽回來的訊息, 是可以改變的. 你認為各位待在這裡的金耳朵, 是天生就會品評音樂及喇叭嗎? 十年前你不懂欣賞音響系統, 不會評別人的錄音品質, 今天卻很在行是因為你的耳朵發育了嗎? 那是學習啊. 透過學習, 我們知道欣賞音響系統要留意甚麼, 也懂得如何表達當中的分別.
回到根本的問題, 我想指出的是48kHz的取樣並不足以包含人所能聽到及分辨到的聲音. 問題之一是人們高估了PCM格式的能力, 也低估了人的聽力. 大家兒時也許已做過聽力測試, 知道也體會聽覺對頻率反應的上限. 然而, 那個測試的結果不足以指出48kHz PCM取樣可以包含人所能聽到的所有內容.
並非 48kHz 無法包含人所能聽到的所有內容, 在數學上它是夠的... 問題只不過是 A/D 和 D/A 沒有無限的精度和完美的濾波器, 以致於在轉換過程中引致了些許的誤差。現今各家頂尖的數位音訊產品, 都是在朝著理想 Nyquist 取樣轉換的目標這個方向在走, 48kHz 取樣就很夠了, 只不過那種東西很貴就是了...
另外, 人類聽覺的確有很大一部份控制在大腦, 但是不是一切都可以經由學習來改變的... 大腦的功能是靠神經網路的建立來決定, 有些是幾乎無法改變的, 比方說人到了少年以後, 幾乎就不可能經由學習而獲得絕對聽覺; 另外, 聽覺器官隨年齡增長, 是會有退化的傾向, 大部份的中年人聽力都會有明顯比年輕時候差的情況, 這不是學習可以補救的。
另外, 人類聽覺的確有很大一部份控制在大腦, 但是不是一切都可以經由學習來改變的... 大腦的功能是靠神經網路的建立來決定, 有些是幾乎無法改變的, 比方說人到了少年以後, 幾乎就不可能經由學習而獲得絕對聽覺; 另外, 聽覺器官隨年齡增長, 是會有退化的傾向, 大部份的中年人聽力都會有明顯比年輕時候差的情況, 這不是學習可以補救的。