关于MP3与MP4介绍

浏览：7367 来源：通信人在线日期：2020-03-02

音乐在因特网上可以以不同的文件格式如AU、WAV或AIFF进行编码和传输。在因特网上上传和下载这样的宽带文件不能很令人满意。如一个3min CD音乐（31.7MB），若通过一个56kbit/s调制解调器，则需要一个小时或更多的时间下载；最有效的方法是通过数据压缩算法将文件压缩，从而使音乐传输得更快。在理想条件下，比特率在96kbit/s以下就可以提供高质量的立体声节目，比特率为64kbit/s就可以提供质量相当不错的立体声，为16kbitls可以提供单声道音乐。在上面任何一种情况下，采用的算法必须能满足实时节目，依靠压缩率，可以有效地下载或实时播放音乐。

1、关于MP3

MP3是由活动图象专家组（Moving Picture Coding Experts Group，MPEG）开发的音频压缩的技术。它的全称是MPEG Audio Layer 3，就是活动图像压缩标准音频层3的意思。因为它是利用了MPEG音频3层的技术，将声音压缩到频带只有原来的1/10到1/12，但是人耳听起来仍然音质很好。由于MP3具有压缩程度高、音质好的突出优点，因而MP3是目前最为流行的一种音乐文件，各种媒体播放器都力图做到具有MP3的播放功能。

MPEG数据压缩算法在文件压缩方面比电子分类应用更加广泛。例如，文件可以在因特网上上传或下载，或附加在电子邮件中。在这种应用中，第III层算法就是被人们所共知的MP3。MP3的好处在于大幅降低数字声音文件的容量，而不会破坏原来的音质。以CD音质的Wave文件来说，如抽样分辨率为16bit，抽样频率44.1kHz，声音模式为立体声，那么存储1秒钟CD音质的Wave文件，必须要用16 bit×44100Hz×2Stereo=1411200bit，也就是相当于1411.2kbits的存储容量，存储介质的负担相当大。不过通过MP3格式压缩后，文件便可压缩为原来的1/10到1/12。每1秒钟的MP3只需大约112~128kbits就可以了。具体数据可以参看下面的1-1和1-2两个表。

表1-1：MPEG的压缩等级（L1~L3）与压缩比率

表1-2：声音品质与MP3压缩比例关系

MP3文件可以存储在硬盘中、记录在CD-ROM中或存储在应用闪存的固态播放器中。上面的任何一种情况，数据都必须通过MP3节目器进行录音重放。MP3算法不代表加密或复制保护，因此，它的内容会被复制。许多共享软件和商业软件程序都可以将音乐文件转换成编码的MP3文件，再在PC上对MP3文件解码。在大多数情况下，在硬盘上首次存储时是作为WAV或AIFF文件存储的，再用专门的硬件或软件压缩成MP3文件。大多数编码器可以实现不同级别的压缩，例如，允许实现28.8kbit/s、64kbit/s、112kbit/s、128kbit/s、192kbit/s和320kbit/s这些不等的传输速率。高比特率可以用44.1kHz的采样频率提供立体声录音重放，而低一点的比特率就不能提供。例如，28.8kbit/s速率可用16kHz采样频率产生单信号。MP3能在96kbit/s的比特率下提供好的效果。尽管MP3与其他一些编解码相比引入了更长的编码延迟，但这并不重要，因为它和因特网固有的传输延迟相比是微不足道的。MPEG编码不提供纠错，若要求纠错，则必须提供额外的信道编码。一般来讲，这种要求在网络应用中是不常见的，但是，将CRC校验与MPEG数据一起传输，可以对大多数敏感的数据进行检错，并可以进行错误隐藏（不是错误纠正），例如，将损坏的帧隐藏，并重发。

MP3文件可以用专门的硬件芯片或软件程序解码。为了优化操作，减少计算量，一些软件解码器具备特殊的性能。混频合成过滤器组的计算是解码器最复杂的计算方面。应用立体声下混合时，可以将上述过程简单化为频域范围内的单一值，然后再进入过滤器组，这样只需要一个过滤器。下混合可以用一个简单而有力的左、右声道组合实现，但这不是个优化的方法，因为像MS立体声或加重立体声这样的信号总是包含很强的信号。所以更为有效的办法是用内置下混合程序，只计算在左、右立体声中编码的比例因子段中的信号，才于MS和加重编码的比例因子段，程序只对其缩放比例。

为了进一步降低计算的复杂性，可以对混频合成过滤器组进行优化。过滤器组由反向限制离散余弦变换(IMDCT )和多相过滤器组组成。IMDCT对18个频谱值执行32次运算，每次将576个频谱转化成18个长度为32的连续频谱。这些频谱通过混频合成过滤器且执行18次运算转换到时域。混合过滤器组包括一个频率映射操作（如矩阵乘法）和一个有512个系数的FIR滤波器。FIR滤波器计算可以通过减少系数的数量来降低计算的复杂性，滤波器系数可以在脉冲响应的末端删减，脉冲响应可以以更少的系数进行调制。试验证明，滤波器长度可以缩短25%而不必给予额外的补偿。更直接地说，计算可以通过限制音频带宽的办法加以简化。高频频谱值可以置零，输入、采样值都置零的IMDCT可以不必计算。如果只有低于半数的IMDCT被计算，音频带宽则被限制。输出值可以被两个因子采样，这样会遗漏对每一秒输出值的计算，从而将FIR计算减少了一半。

许多公司生产便携的闪存播放器，这些播放器可以从主机下载MP3文件，通过一个随机携带的MP3解码器实现录音重发。数据存储在智能媒体、压缩闪存、多媒体卡或其他不易丢失的存储组件中。MP3可将一个典型的歌曲压缩成大约5MB，从而可以使歌曲在5min内通过调制解调器下载，还可以提供高质量的音频。MP3文件可以以不同速率编码，相应下载时间或快或慢。然而，对于不同的解码格式是不能升级的。换句话说，解码器不能有选择地挑选整个比特流的子集使之再生不同质量的信号。

通过因特网传输音乐MP3是个很好的选择。它的好处也导致一些人对它滥用，有人非法去地将盗版音乐的MP3文件贴在他们的主页上，让大家自由下载。

2、关于MP4

MP4并不是MPEG-4或者MPEG-1 Layer 4，它的出现是针对MP3的大众化、无版权的一种保护格式，由美国网络技术公司开发，美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。

从技术上讲，MP4使用的是MPEG-2 AAC技术也就是俗称的alb或AAC o其中，MPEG-2是MPEG于1994年11月针对数码电视（数码影像）提出的。它的特点就是，音质更加完美而压缩比更加大（1﹕15）。MPEG-2 AAC（ISO/IEC 13818-7）在采样率为8~96KHz下提供了1~48个声道可选范围的高质量音频编码。AAC就是Advanced Audio Coding（先进音频编码）的意思，适用于从比特率在8kbit/s单声道的电话音质到160kbit/s多声道的超高质量音频范围内的编码，并且允许对多媒体进行编码/解码。AAC与MP3相比，增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性，使得在音频压缩后仍能完美的再现CD音质。

AAC技术主要由以下3个部分组成：第一，AT&T的音频压缩技术专利，它可以将AAC压缩比提高到20﹕1而不损失音质，这样，一首3分钟的歌仅仅需要2.25MB，这在互联网上的下载速度是很惊人的；第二，安全数据库，它可以为AAC Music创建一个特定的密钥，将此密钥存于其数据库中，同时，只有AAC的播放器才能播放含有这种密钥的音乐；第三，协议认证，这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。它的工作原理如下：首先认证该歌曲内部的密钥，然后核实安全数据库中的密钥并找到其许可协议。这样就决定了歌曲以何种形式播放以及是否可以拷贝、贩卖。同时，数据库中的许可协议可以应用户要求随时修改，使得AAC歌曲本身包含的版权信息也可以随时更换。这是一种融合了版权的音乐技术，解决了MP3带来的版权冲击问题。

MP4技术的优越性要远远高于MP3，因为它更适合多媒体技术的发展以及视听欣赏的需求。但是，MP4是一种商品，它利用改良后的MPEG-2 AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准；而MP3是一种自由音乐格式，任何人都可以自由使用。此外，MP4实际上是由音乐出版界联合授意的官方标准；MP3则是广为流传的民间标准。相比之下，MP3的灵活和自由度要远远大于MP4，这使得音乐发烧友们更倾向于使用MP3。更重要的一点是，MP3是目前最为流行的一种音乐格式，它占据着大量的网络资源，这使得MP4的推广普及难上加难。长远来看，MP4的流行是迟早的事（指其优越的技术性）。但是如果MP4不改进其技术构成（即强加的版权信息）的话，那么当自由的MP3使用了MPFG-2 AAC的技术后，胜负就很明显了。

欲更多了解其他音频压缩格式的请进入。

附录

本文的所有附表2017-10-17