[科普中国]-脉冲编码调制-

脉冲编码调制（PulseCodeModulation），简称PCM。是对连续变化的模拟信号进行抽样、量化和编码产生的数字信号。PCM的优点就是音质好，缺点就是体积大。PCM可以提供用户从2M到155M速率的数字数据专线业务，也可以提供话音、图象传送、远程教学等其他业务。PCM有两个标准（表现形式）：E1和T1。

脉冲编码调制(Pulse Code Modulation)是最常用、最简单的波形编码。它是一种直接、简单地把语音经抽样、A/D转换得到的数字均匀量化后进行编码的方法，是其他编码算法的基础。

简介脉冲编码调制 (Pulse Code Modulation)是一种对模拟信号数字化的取样技术，将模拟语音信号变换为数字信号的编码方式，特别是对于音频信号。PCM 对信号每秒钟取样 8000 次；每次取样为 8 个位，总共 64kb。取样等级的编码有二种标准。北美洲及日本使用 Mu-Law 标准，而其它大多数国家使用 A-Law 标准。

脉冲编码调制主要经过3个过程：抽样、量化和编码。抽样过程将连续时间模拟信号变为离散时间、连续幅度的抽样信号，量化过程将抽样信号变为离散时间、离散幅度的数字信号，编码过程将量化后的信号编码成为一个二进制码组输出。

所谓量化，就是把经过抽样得到的瞬时值将其幅度离散，即用一组规定的电平，把瞬时抽样值用最接近的所谓编码，就是用一组二进制码组来表示每一个有固定电平的量化值。

历史Claude E. Shannon于1948年发表的“通信的数学理论”奠定了现代通信的基础。同年贝尔实验室的工程人员开发了PCM技术，虽然在当时是革命性的，但脉冲编码调制被视为是一种非常单纯的无损耗编码格式，音频在固定间隔内进行采集并量化为频带值，其它采用这种编码方法的应用包括电话和CD。PCM主要有三种方式：标准PCM、差分脉冲编码调制(DPCM)和自适应DPCM。在标准PCM中，频带被量化为线性步长的频带，用于存储绝对量值。在DPCM中存储的是前后电流值之差，因而存储量减少了约25%。自适应DPCM改变了DPCM的量化步长，在给定的信噪比(SNR)下可压缩更多的信息。

脉冲编码调制是20世纪70年代末发展起来的，记录媒体之一的CD，80年代初由飞利浦和索尼公司共同推出。脉码调制的音频格式也被DVD-A所采用，它支持立体声和5.1环绕声，1999年由DVD讨论会发布和推出的。脉冲编码调制的比特数，从14-bit发展到16-bit、18-bit、20-bit直到24-bit；采样频率从44.1kHz发展到192kHz。PCM脉码调制这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM脉码调制比特率和采样率，不能根本的改善它的根本问题。其原因是PCM的主要问题在于：

（1）任何脉冲编码调制数字音频系统需要在其输入端设置急剧升降的滤波器，仅让20Hz-22.05kHz的频率通过（高端22.05kHz是由于CD44.1kHz的一半频率而确定）。

（2）在录音时采用多级或者串联抽选的数字滤波器（减低采样频率），在重放时采用多级的内插的数字滤波器（提高采样频率），为了控制小信号在编码时的失真，两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。

为了全面改善脉冲编码调制数字音频技术，获得更好的声音质量，就需要有新的技术来替换。飞利浦和索尼公司再次联手，共同推出一种称为直接流数字编码技术DSD的格式，其记录媒体为超级音频CD即SACD，支持立体声和5.1环绕声。DSD是PCM脉冲编码调制的进化版1。

原理脉冲编码调制就是把一个时间连续，取值连续的模拟信号变换成时间离散，取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样，再对样值幅度量化，编码的过程。

抽样，就是对模拟信号进行周期性扫描，把时间上连续的信号变成时间上离散的信号。该模拟信号经过抽样后还应当包含原信号中所有信息，也就是说能无失真的恢复原模拟信号。它的抽样速率的下限是由抽样定理确定的。抽样速率采用8Kbit/s。

量化，就是把经过抽样得到的瞬时值将其幅度离散，即用一组规定的电平，把瞬时抽样值用最接近的电平值来表示。

一个模拟信号经过抽样量化后，得到已量化的脉冲幅度调制信号，它仅为有限个数值。

编码，就是用一组二进制码组来表示每一个有固定电平的量化值。然而，实际上量化是在编码过程中同时完成的，故编码过程也称为模/数变换，可记作A/D。

话音信号先经防混叠低通滤波器，进行脉冲抽样，变成8KHz重复频率的抽样信号（即离散的脉冲调幅PAM信号），然后将幅度连续的PAM信号用“四舍五入”办法量化为有限个幅度取值的信号，再经编码后转换成二进制码。对于电话，CCITT规定抽样率为8KHz，每抽样值编8位码，即共有28=256个量化值，因而每话路PCM编码后的标准数码率是64kb/s。为解决均匀量化时小信号量化误差大，音质差的问题，在实际中采用不均匀选取量化间隔的非线性量化方法，即量化特性在小信号时分层密，量化间隔小，而在大信号时分层疏，量化间隔大。

在实际中使用的是两种对数形式的压缩特性：A律和U律，A律编码主要用于30/32路一次群系统，U律编码主要用于24路一次群系统。A律PCM用于欧洲和中国，U律PCM用于北美和日本。

编码脉冲编码调制编码原理与规则：PCM数字接口是G.703标准，通过75Ω同轴电缆或120Ω双绞线进行非对称或对称传输，传输码型为含有定时关系的HDB3码，接收端通过译码可以恢复定时，实现时钟同步。Fb为帧同步信号，C2为时钟信号，速率为2.048Mbps，数据在时钟下降沿有效，E1接口具有PCM帧结构，一个复帧包括16个帧，一个帧为125μs，分为32个时隙，其中偶帧的零时隙传输同步信息码0011011，奇帧的零时隙传输对告码，16时隙传输信令信息，其它各时隙传输数据，每个时隙传输8比特数据。

差分脉冲编码调制(DPCM)

波形编码器的一个重要分支称为差分编码器。这一类编码器包括增量调制(DM)和差分脉冲编码调制(DPCM)。差分编码器的工作原理就是消除冗余和减熵。消除冗余是对输入样本与预测值之差进行量化，达到一定的幅值水平。因此，差分编码器的两个重要组成部分就是预测器和量化器。

DPCM的工作原理以时刻k-1的输出值为基础预测时刻 k的预测值。记为 ŝ (k|k-1)，从时刻k的输入信号s(k)中减去预测值，得到预测误差信号e(k)，量化预测误差，然后对量化的预测误差eq(k)进行编码，传送到接收端。eq(k)加上同样编码后的ŝ(k|k-1)就得到了输入样本重构值ŝ (k)。假定不存在信道误差，接收端可准确完成重构。在发送端和接收端，均能以时间k的重构值为基础预测时刻k+1的预测值，然后重复以上的过程。

DPCM系统的主要成分是量化器、二进制编码器/解码器和预测器。

嵌入式差分脉冲编码调制

在通信和计算机网络中，不论何时出现通信繁忙的情况，都允许网络减轻负载，这有时是一个优势。如果允许在传送数据时丢掉最不重要的位，而且信源也不用重新编码，这样就可以实现前面的设想，可是，并不是所有信源的数据表示都可以这样做而不引起重构信源的较大误差，实际上，大多数压缩数据都不能这样简单地丢弃一个位，在这些情况下(Goodman1980)用嵌入编码的压缩方法来处理。

多脉冲线性预测编码(MPLPC)

多脉冲线性预测编码具有 LPC(线性预测编码)和 ADPCM(自适应差分脉冲编码调制)的预测编码结构，它与这些系统的不同之处在于它是一个分析-综合编码器，并采用感知权重设定。 MPLPC试图通过改进激励模型提高LPC的性能，但是不希望像 ADPCM和其他一些波码器那样直接量化、传送预测误差。为达到这一点，MPLPC采用几个脉冲作为一个语音帧的合成滤波器激励。脉冲数量事先选好，但需要考虑复杂性和语音品质。一般看来，MPLPC需要防止提取脉冲间隔。对于16kbit/s以下的高品质语音，其激励搜索的复杂度是可以容忍的，需要一个间隔预测循环。

码激励线性预测编码

码激励线性预测编码(CELP)是在9.6kbit/s以下速率中广泛应用的语音编码。其目的是将多脉冲 LPC中使用的分析-综合方法扩展到低比特率范围。指导思想是用有限数量的存储序列替代多脉冲激励。这个序列为码本。 CELP中的码本编码方法基于下面两个事实。

（1）用长时或短时预测清除语音信号的冗余之后，剩余信号序列相互独立可用，具有相同概率分布的随机变序列所精确模拟，这个序列称为更新序列或激励序列。

（2）为了编码，可以找出有限数量的序列近似在语音片段中出现的重要激励序列。这个激励序列称为码本。

由于这两个因素，先要找出给定块的语音编码最好的长时和短时预测器，用各种可能的激励作用于它们，然后找出码本中的序列，生成与输入语音最相似的合成语音信号。长时和短时预测器信息和从码本中选出的激励序列的二进制数全都送入接收端进行合成。

Atal和 Schroeder(1984)首次成功地证明了码激励方法的有效性。

通常，在考虑频谱的精细结构时，语音过程可由长时预测器建模。在考虑频谱范围和共振时可由短时预测器来给出基音。

在随机编码的研究中，级联预测器的激励是一个 Gaussian分布的白噪声序列。为了用这个结构对语音编码，每5～25ms就要用 LPC中的技术对长时和短时预测器编码。随机编码或 CELP的目标是提高LPC品质，提供一种对基音提取不敏感并且不依赖于清/浊音分类的方法，这和 LPC有所不同。

在随机码本中，只需要较少码字就可以产生良好的性能，Atal和 Schroeder的研究可以使1 024个码表示40个样本，尽管1 024看起来很大，如果我们用一个独立的二进制数表示这40个语音样本中的每一个时，我们将有2=10种可能的序列。由此看来，1 024相对要小多了。甚至有些系统的码本只有256个。

除了随机码本，研究者还研究了卷积码，向量量化，置换码和经验设计码本，这些在语音编码中都可以应用，有些码本对一些说话者的语音来说比其他码本要好，当然，码本中包含较多序列可以提高性能，也使复杂度和数据速率增加。

激励码本的脱机训练可以提高合成语音的品质，这似乎是一个规律。然而，最近的研究可以使码本中所有脉冲具有同样的幅值水平，合成语音品质不受影响，如果找到一种方法能高效地搜索激励脉冲位置，那么编码综合分析搜索就可以大大简化。

标准E1是PCM其中一个标准（表现形式）。由PCM脉码调制编码中E1的时隙特征可知，E1共分32个时隙TS0-TS31。每个时隙为64K，其中TS0为被帧同步码，Si，Sa4，Sa5，Sa6，Sa7，A比特占用，若系统运用了CRC校验，则Si比特位置改传CRC校验码。TS16为信令时隙，当使用到信令(共路信令或随路信令)时，该时隙用来传输信令，用户不可用来传输数据。所以2M的PCM码型有

（1）PCM30：PCM30用户可用时隙为30个，TS1-TS15，TS17-TS31。TS16传送信令，无CRC校验。

（2）PCM31：PCM30用户可用时隙为31个，S1-TS15，TS16-TS31。TS16不传送信令，无CRC校验。

（3）PCM30C：PCM30用户可用时隙为30个，TS1-TS15，TS17-TS31。TS16传送信令，有CRC校验。

（4）PCM31C：PCM30用户可用时隙为31个，TS1-TS15，TS16-TS31。TS16不传送信令，有CRC校验。

CE1，就是把2M的传输分成了30个64K的时隙，一般写成N*64，

CE1----最多可有31个信道承载数据timeslots1----31timeslots0传同步

PCME1形式结构在PCME1形式信道中，8bit组成一个时隙（TS），由32个时隙组成了一个帧（F），16个帧组成一个复帧（MF）。在一个帧中，TS0主要用于传送帧。定位信号（FAS）：CRC-4（循环冗余校验）和对端告警指示，TS16主要传送随路信令（CAS）、复帧定位信号和复帧对端告警指示，TS1至TS15和TS17至TS31共30个时隙传送话音或数据等信息。称TS1至TS15和TS17至TS31为净荷，TS0和TS16为开销。如果采用带外公共信道信令（CCS），TS16就失去了传送信令的用途，该时隙也可用来传送信息信号，这时帧结构的净荷为TS1至TS31，开销只有TS0。

PCME1形式接口G703非平衡的75ohm，平衡的120ohm2种接口2。

PCME1的三种方法（1）将整个2M用作一条链路，如DDN2M；

（2）将2M用作若干个64k及其组合，如128K，256K等，这就是CE1；

（3）在用作语音交换机的数字中继时，这也是E1最本来的用途，是把一条E1作为32个64K来用，但是时隙0和时隙15是用作signaling即信令的，所以一条E1可以传30路话音。PRI就是其中的最常用的一种接入方式，标准叫PRA信令。用2611等的广域网接口卡，经V.35-G.703转换器接E1线。这样的成本比E1卡低，DDN的2M速率线路是经HDSL线路拉至用户侧。E1可由传输设备出的光纤拉至用户侧的光端机提供E1服务。

PCME1形式使用注意事项PCME1形式接口对接时，双方的E1不能有信号丢失/帧失步/复帧失步/滑码告警，但是双方在E1接口参数上必须完全一致，因为个别特性参数的不一致，不会在指示灯或者告警台上有任何告警，但是会造成数据通道的不通/误码/滑码/失步等情况。这些特性参数主要有；阻抗/帧结构/CRC4校验

PCME1形式阻值有75ohm和120ohm两种，PCME1形式帧结构有PCM31/PCM30/不成帧三种。

PCME1形式和PCME2形式区别（1）PCMT1形式是高速传输的另一种标准。一条PCMT1形式可以同时有多个并发信道，每个信道都是一个独立的连接。在美国的标准PCMT1形式服务提供24个信道，每个信道的速率是56K。PCMT1形式服务与其相应的设备ISDN和普通电话相比都更加昂贵。而PCME2形式相对费却较少。

（2）PCMT1形式通常用于需要在远程站点间进高带宽高速率传输的大型组织。64K专用数据线（DDL）作为T1服务的一个变种或一个分支服务，也提供此类服务。而一条PCME1形式线，只要有ProxyServer提供的缓冲功能，在同等传输下，比PCMT1形式可以有效地节省带宽。

（3）PCMT1形式提供23个B信道和一个D信道，即23B+D.1.544Mbps；PCME1形式提供30个B信道和一个D信道，即30B+D.2.048Mbps

（4）PCMT1形式表示具有高质量的通话和数据传送界面，北美使用T1标准，能够支持Max的24位用户同时拔号，而欧洲使用E1标准，可以支持30位用户，PCMT1形式仅是MAX的简单接口。

时分复用所谓时分复用，是将某一信道按时间加以分割，各路信号的抽样。值依一定的顺序占用某一时间间隔（也成时隙），即多路信号利用同一信道在不同的时间进行各自独立的传输。

时分复用的特点：

1、复用设备内部各通路的部件基本通用

2、要求收、发两端同时工作，要求有良好的同步系统。

时分复用的目的：一个信道传输多路信号，即若干路信号可以采用时分复用方式以一定的

结构形式复接成一路高速率的复合数字信号－群路信号。数字复接包括bit复接和码组复接。

PCM-30/32路通信设备是采用码组复接的时分复用系统。

在30/32路PCM系统中，帧结构中第一个时隙TS0用于传送帧同步信号，TS16用于传送话路信令，故只有30个时隙用于传送话音信号，所以只能提供30个话路。当采用共路信令传送方式时，必须将16帧再构成一个更大的帧，称为复帧。复帧的重复频率为500Hz，周期为2ms。

数字电话都采用PCM方式。对PCM系统，国际上采用PDH（准同步）复接技术。此技术有两种制式，一种是北美和日本采用的24路话音信号复接成一个基群的T制，速率是1554kbit/s;一种是欧洲和我国采用的30/32路话音信号复接成一个基群的E制，速率为2048kbit/s。为了进一步提高信道利用率，国际电联规定四个基群复接成一个二次群，四个二次群复接成一个三次群，四个三次群复接成一个四次群3。

本词条内容贡献者为:

李嘉骞 - 博士 - 同济大学