在图文传真机中,图文数据用二进制数表示,每位二进制数据代表1bit,对应原始图文一个像素。因此,每幅图文的像素总数等于图文数据的比特总数。这样,图文数据的信息量是相当大的,要提高传真机的传输速率,必须对图文数据的传息量进行压缩。传真通信是一种静止图文的传送,在这个过程中,整幅图文经历了一个分解与合成的过程。因此,无论原稿有多么复杂,经过分解(扫描)之后,它都是一连串黑白点的集合,在经过光电变换后的扫描器输出中,它都是一连串在时间上不连续的脉冲电信号。这些输出的脉冲电信号,便是传真的信号源,我们称之为信源。
从数学的观点来看,信源是一个概率空间,它的作用是按样本空间的概率分布一个接一个地把样本发出去。这一序列样本,便叫做消息,消息中的不肯定成分,才是我们通常所说的信息。一般来说,消息中含有信息,但消息不一定完全是信息。信源发出的消息中不肯定程度越大,夹带的信息就越多,反之就越少。在这里,不肯定程度是信源各消息(或符号)的函数。信息的多少(信息量)最终决定于信源内各消息的概率分布。
任何种类的通信都是以传递信息为目的。为了提高通信系统的有效性和利用率,人们采取了各种各样的手段,其中最重要的便是对消息进行预加工,去掉那些可以肯定的成分(称为剩余度或冗余度),只传递那些一定要传送的东西,以此来提高信息的含量。这里有两个关键问题要解决:一是信源中有没有冗余度?二是如何去掉它们?三类传真机正是从对传真信号的统计分析着手,有效地解决了这两个间题,才获得了文件高速传递的效果。
数字化编码压缩基于传真信号的统计性质。数字传真机利用传真稿件的统计特性来削减多余度,从实用的观点出发,实际利用的统计特性主要有:白像素和黑像素发生概率的差异;相邻像素之间的相关性以及统计量因图文不同而存在的差异等。表1列出7种中文铅印文件的统计情况。由表1可以看出:
表1:7种中文铅印文件的各种概率
1)白像素出现的概率大于90%;
2)黑像素出现的概率小于10%,甚至不到5%;
3)由白像素变为黑像素出现的概率比白像素单独出现的概率小得多,也比黑像素单独出现概率小;
4)由黑像素变为白像素出现的概率比白像素单独出现的概率小得多,但也比黑像素单独出现的概率大。
这说明相邻像素之间存在着很强的相关性,在主、副扫描方向也都存在这种相关性。结合某一具体的像素来说,只要知道它上下前后像素的黑白情况,就可大致判定它是黑还是白。传真信号在实现编码压缩时正是利用这种统计特性理论为基础的。通过上面的讨论还得知如下表2的相关结论。
表2:像素的概率与相关性
利用上述的统计特性对黑白像素持续长度编码,可使数据量得到压缩。如对出现概率最大的持续长度用最短的码字表示,而对出现概率最小的持续长度用最长的码字表示。也就是根据持续长度出现的不同概率,分配不同长度的码字,码的长度与概率分布相匹配,这种编码方法,称为统计匹配方法。由于它用最低限度的数据量传递持续长度所包含的信息,数据的压缩率就会很高,所以又称为最佳编码。
编码,就是赋予每个数据一个对应的代码,把一个数据序列变换成另一个数据序列。如果编码后的数据序列短于编码前的数据序列,说明数据被压缩了。同样,也缩短了传输时间或节省了传输频带。由于这种编码减少了信源的冗余度,因此也叫做信源编码。
传真信号转变为数字信号后,白像素用“0”表示,黑像素用“1”表示,则每一个二进制码“0”或“1”都表示一位图像信号。这样一行标准的A4幅面的图像信号经过光电变换分解成1728个图像信号,也就需要1 728bit表示,并要传输这1 728bit的信息量,如果采用不同的扫描线密度和常用几种白纸时,我们就可以算它们能有多少行了。
例如:一张A4文件的数据总量为
(210mm×8点)×(297mm×3.85线/mm)=1 920 996bit。
以9 600bit/s的速率传送这些数据所需要的时间为
1 920 996÷9600=207s(约3min)。
如通过编码压缩,可压缩1/20之多,这样传输时间可减为207÷20=10s左右了。由此可见,在传真信号中存在着很大的多余度,如何去掉这些多余度,就是编码压缩的目的。
例如:一条长216mm全白扫描线的白像素为1 728个,其信息量为1 728bit,通过编码将其转化为010011011的码字,信息量变成了9bit,从而压缩了大量的信息多余度。因此,从总体上说来,编码后的码序列平均持续长度,还是远远短于编码前的码序列平均持续长度。一般压缩比为3~20倍,平均压缩比为5~6倍。
在三类机中,除了经过对信号游程进行编码,充分利用信号水平方向和垂直方向的相关径,去除信息中的冗余度,以实现频带压缩外,还采用了可以自动选择通信速率,并具有自动均衡性能的调制解调器,使传真通信能在最佳状态下进行。因此,在同样的线路上,三类机往往能够得到比一二类机更快更好的通信效果。
ITU为G3机规定了必备的两种编码方式:一维编码,即霍夫曼编码MH码;二维编码,即霍夫曼编码MR码。
欲详细了解G3传真机编码方式的请进入。
欲进一步了解G3传真机基本参数要求的请进入。