本文作者:辰谙
相信刚接触音乐制作不久的同学们都会在各种硬件和软件上看到一些关于“比特深度”的字眼。而关于比特深度,则有着16bit、24bit乃至32bit的一些选项可供选择。
音频领域的所谓的“比特深度”,其实就是计算机在记录音频数据时的一种精度。这种精度与音频文件的一些指标息息相关。
1
计算机的数据储存
众所周知,自从计算机被发明出来至今,计算机中的数据都是用0和1构成的二进制体系表示的,即数据的最小单位的每一位(bit)都只能取值0或1。
具体到数据存储时,计算机里的数据都是以字节(Byte)为单位的,而一个字节占用8位。我们常见的一些单位,如GB、MB、KB等与字节和位之间的关系是:1GB=1024MB;1MB=1024KB;1KB=1024Byte;1Byte=8bit。
我们以记录图片信息为例。如果一个图片格式支持256种颜色,那么我们就需要256=2^8个不同的值来表示不同的颜色,换成二进制就是00000000到11111111。
计算机记录图片信息时想要囊括这么多值,就需要用到8位的二进制数,我们便规定这种图片格式的颜色深度是8Bit。
2
音频的比特深度
在记录音频信息的时候,计算机的工作方式与记录图片信息时有相似之处,也有其特殊的地方。我们都知道,关于音频的一些指标有响度、频率等。这些指标在进入计算机之前,都是一些模拟信号,故而只懂数字信号的计算机无法理解。
这个时候,就需要有声卡的帮助。声卡可以将模拟信号转换成数字信号,来使得计算机可以将声音作为数字音频文件储存下来。等要播放音频文件的时候,计算机再通过声卡将数字信号转换成模拟信号,传输到音响或耳机中播放出去。
在这个环节中,很重要的一点便是模拟信号和数字信号的相互转换。可以说,这个转换环节直接影响了录音和放音的质量。而计算机在将模拟信号转换为数字信号的时候,必然会面临一个转换精度的问题。
还是拿图片数据举例,我们的数码相机在拍照的时候,是将光学信号转换成数字信号加以存储。但是,不同档次的相机拍摄出来的照片的质量都会有所不同,这就是因为不同的相机有着不同的采样精度。这个采样精度,外在表现在照片的像素和颜色细腻程度等方面。
当然,不管相机的采样精度多高,都是无法在照片中百分百还原自然光的。毕竟,通过热力学第二定律我们可以得知,设备的精度无论有多高,其都是无法以百分百的效率将物理信号转换为数字信号的。
那么,我们要想获得更好的体验,则必须在尽可能的范围内将精度提高,直到超出人类可感知的生理极限。于是在音频领域,我们便有了16bit、24bit乃至32bit的采样精度。
3
用哪种精度比较好呢?
音频的比特深度即采样精度是与音频文件的动态范围相挂钩的,说得直白一点,就是音频的声音大小的范围。我们一般将数字音频的电平的峰值定为0dBFS,正常的电平都是0dBFS以下的负值。
以16bit的格式为例,该格式可取的动态范围为2的16次方即65536个单位,换算成dB,即20×log(65536)≈96dB。也就是说,这个格式的动态范围为96dB。值得一提的是,以往实体唱片的CD格式都是采用16bit的采样精度的。
那么,其他比特深度的动态范围的计算也都是同理了。通过公式20×log(2^n)我们可以得出24bit和32bit的动态范围分别为144dB和193dB(取整数)。
对于大多数听众来说,其实16bit的动态范围范围已经足够了。这也是目前很多制作人还是像实体唱片时代那样,坚持采用16bit的采样精度的原因。
不过,很多混音师还是倾向于接收24bit的分轨来进行混音母带等后期操作。毕竟在混音的时候,如果音轨能留出足够的动态范围的话,那对混音师的操作来说是十分友好的。