欢迎来到通信人在线![用户登录] [免费注册]

相关已标准化的语音及音频编码技术的性能比较

浏览:5866  来源:通信人在线  日期:2020-03-02

随着通信技术的发展,近几十年来出现了许多语音及音频编码技术和算法。由于通信技术的发展对语音编码不断提出新的要求,同时随着语音及音频编码技术的不断成熟,在这一时期产生了一系列语音及音频编码的国际标准和地区标准。这些标准不但反映了语音及音频编码技术的发展历程和现状,也反映出语音及音频编码技术的发展趋势和方向。

下面对相关已标准化的语音及音频编码技术进行简单比较。主要是针对其编码速率、语音质量、时间复杂度(MIPS)、空间复杂度(RAM)、帧的长度、预留时间、编码算法类型等参数。

一、ITU-T的电话语音编码标准

ITU-T 制定了一系列主要是应用于电话通信语音编码的标准(G.7xx系列)。ITU-T主要是由第15研究组(SG 15)负责语音标准的制定,其他一些研究组也提出一些特殊应用的语音标准。SG 15负责建立参考条款(ITU-T的内部文件)的总体责任,SG 12的语音质量专家组(SQEG)协助SG 15制定语音质量的目标并负责设计和指导实验程序,确定候选的编码器是否符合要求。

ITU-T制定的各种电话通信语音编码技术,主要是上世纪末阶段,首先在1972年颁布了G.711PCM编码标准(64kbit/s),到1998年公布的4kbit/s 编码标准。ITU-T1994年前和1995年后陆续公布的电话带宽语音编码标准分别详见下表1-11-21995年后陆续公布的电话带宽语音编码标准的编码速率将更低。ITU-T制定的音频编码技术不多(有G.722G.725),主要研究制定的是电话通信的语音编码技术。

1-1ITU-T1994年前公布的电话语音编码标准的参数

1-2ITU-T1995年后公布的电话带宽语音编码标准的参数

欲进一步了解ITU-T G.7xx系列建议介绍的请进入

二、关于移动通信语音编码技术

1、北美数字蜂窝移动通信语音编码标准

美国TIATR-45分会主要负责制定北美数字蜂窝移动通信语音编码标准,TR-30分会负责同时具有声音和数据的调制解调标准。北美数字蜂窝移动通信语音编码标准详见下表2-1所示。

2-1:北美数字蜂窝移动通信语音编码标准的参数

2、欧洲数字蜂窝移动通信语音编码标准

欧洲电信标准化协会(ETSI)对语音编码有很大影响的一个例子就是TCS-HS。这个实体就是在1987年制定了全欧数字蜂窝移动通信TDMA标准GSMGSM采用ETSI规范的13kb/s速率的长时预测-规则脉冲激励线性预测语音编码标准,后来TCH-HS又提出了一个“半速率”语音编码标准,其系统容量是原来系统的2倍。欧洲数字蜂窝移动通信语音编码标准如表2-2所示。

2-2:欧洲数字蜂窝移动通信语音编码标准的参数

3、日本的数字蜂窝移动通信语音编码标准

日本的RCR负责制定了日本的数字蜂窝移动通信语音编码。日本的数字蜂窝移动通信语音编码标准详见下表2-3

2-3:日本的数字蜂窝移动通信语音编码标准的参数

三、国际海事卫星组织的卫星通信语音编码标准

国际海事卫星组织(INMARSAT)1990年公布了应用于卫星通信的IMBE(改进型多带激励编码)4.15kb/s语音编码标准。具体详见下表3-1

3-1:国际海事卫星组织公布的4.15 kb/sIMBE语音编码标准的参数

四、美国的保密通信语音编码标准

为了保密通信,美国的DOD制定了一系列应用美国的保密通信的语音编码标准,具体详见下表4-1

4-1:美国的保密通信语音编码标准的参数

五、ISO的多媒体应用的音频压缩编码标准

近年来随着功能强大、价格便宜的个人计算机进入千家万户,多媒体的应用愈来愈广泛。在多媒体用领域中,文本、图象、电视、电影和声音都被存储在计算机中,然后再显示、编辑和回放。ISO在对多媒体数据进行MPEG压缩和处理时,对音频的压缩已经成为MPEG视频压缩中不可分割的一部分。这里的对音频的压缩编码,与前述的几种语音编码技术不同的是,前述的几种语音编码技术主要是对话音频带(300 Hz~3400Hz)进行压缩编码,而ISOMPEG的音频压缩编码是对声音频带的编码,我们知道人耳能听到的声音频率范围大约为20 Hz~22000Hz

1MPEG-1音频压缩编码标准

ISO/IEC 11172-3标准是MPEG-1音频压缩编码标准。此标准规定了MPEG-1音频层数据压缩编码的方法。标准中有三个处理级别,分别称为第Ⅰ、Ⅱ、Ⅲ层,第Ⅰ层是基本模式,其余两层有更多的处理,因而在相同的听觉质量下,将会有更高的压缩效率。

此标准主要用于一般音频信号的处理,特别是与各种数字视频应用有关的音频信号的处理。MPEG-1可以提供取样频率为32 kHz44.1 kHz48 kHz的单声道或立体声。表5-1给出了第Ⅰ、Ⅱ、Ⅲ层的性能和应用领域。可见,由第Ⅰ层到第Ⅲ层压缩效率和听觉质量逐层提高。第Ⅲ层的压缩算法我们常称之为MP3。表5-2给出了MPEG-1音频第Ⅰ、Ⅱ层参数的比较。

5-1MPEG-1音频第Ⅰ、Ⅱ、Ⅲ层音频编码的参数

5-2MPEG-1音频第Ⅰ、Ⅱ层参数的比较

2MPEG-2音频压缩编码标准

ISO/IEC 13818-3标准是MPEG-2音频压缩编码标准。此标准是MPEG委员会在199411月通过的。MPEG-2音频压缩的应用范围包括数字HDTV电视节目的发送以及从因特网上的下载等。它可以向后兼容多声道声音、低取样率以及高级音频编码(AAC)这一类非向后兼容的多声道声音。

MPEG-2音频压缩编码标准包括MPEG-1音频压缩编码标准的第Ⅰ、Ⅱ、Ⅲ层,使用相同的编码和译码原理。在许多情况下,为了应用MPEG-1所设计的算法,也适用于MPEG-2。多声道的MPEG-2音频向后兼容MPEG-1MPEG-2的译码器可以接收MPEG-1的比特流。MPEG-1的译码器可以从MPEG-2的比特流中得到立体声。MPEG-2允许使用不兼容的音频编码器。MPEG-2可以提供取样频率为32 kHz44.1 kHz48 kHz的多声道声音。MPEG-2向后兼容MPEG-1,通常用BC表示向后兼容,则可以表示为MPEG-2BCMPEG-2也支持取样频率为16 kHz22.05 kHz24 kHz的单声道和立体声编码。

3MPEG-4音频压缩编码

MPEG-4MPEG-2AACMPEG-4音频编码来支持高质量单声道、立体声和多声道信号的编码。MPEG-4还特别针对非常低的比特率,例如针对64~2kb/s的自然音频进行编码。当其使用变速率编码时,甚至可以对低于 2 kb/s以下的自然音频编码,例如,可以对1.2 kb/s速率的音频编码。MPEG-4也支持中等质量的音频编码。对于这一质量等级的音频信号,从使用8 kHz的取样频率开始。MPEG-4支持宽带话音编码、窄带话音编码、智能话音编码、语音合成以及音频合成。定义了4个音频的分布图,提供对极低比特率话音进行参数编码的合音矢量激活编码(HVXC)器、对窄带/宽带话音进行编码的CELPC编码器和一个文字到话音的接口。

欲更多了解关于语音编码知识的请进入相关标准化组织语音编码标准常用的语音编码的相关特性比较按语音编码速率分类的编码技术比较

附录
联合国儿童基金会助学
© 2004-2024 通信人在线 版权所有 备案号:粤ICP备06113876号 网站技术:做网站