第二章-数据通信基础
计算机网络采用数据通信方式传输数据。数据通信和电话网络中的语音通信不同,也和无线电广播通信不同,它有其自身的规律和特点。数据通信技术的发展与计算机技术的发展密切相关,又互相影响,形成了一 门独立的学科。这门学科主要研究对计算机中的二进制数据进行传输、交换和处理的理论、方法以及实现技术。本章讲述数据通信的基本理论和基础知识,为学习以后各章内容做好准备。
2.1 数据通信的基本概念
通信的目的就是传递信息。通信中产生和发送信息的一 端叫作信源,接收信息的 一 端叫作信宿,信源和信宿之间的通信线路称为信道。信息在进入信道时要变换为适合信道传输的形式,在进入信宿时又要变换为适合信宿接收的形式。信道的物理性质不同,对通信的速率和传输质量 的 影响也不同 。另外,信息在传输过程中可能会受到外界的干扰,把这种干扰称为噪声。不同的物理信道受各种干扰的影响不同,例如,如果信道上传输的是电信号,就会受到外界电磁场的干扰,光纤信道则基本不受电磁场干扰。以上描述的通信模式忽略了具体通信中的物理过程和技术细节,得到如图 2-1 所示的通信系统模型。
作为一般的通信系统,信源产生的信息可能是模拟数据,也可能是数字数据。模拟数据取连续值,而数字数据取离散值。在数据进入信道之前要变成适合传输的电磁信号,这些信号也可以是模拟的或数字的。模拟信号是随时间连续变化的信号,这种信号的某种参量 (如幅度、相位和频率等)可以表示要传送的信息。电话机送话器输出的话音信号、电视摄像机产生的图像信号等都是模拟信号。数字信号只取有限个离散值,而且数字信号之间的转换几乎是瞬时的,数字信号以某一瞬间的状态表示它们传送的信息。
如果信源产生的是模拟数据并以模拟信道传输,则叫作模拟通信;如果信源发出的是模拟数据且以数字信号的形式传输,那么这种通信方式叫数字通信。如果信源发出的是数字数据,当然也可以有两种传输方式,这时无论是用模拟信号传输或是用数字信号传输都叫作数据通信。可见,数据通信是专指信源和信宿中数据的形式是数字的,在信道中传输时可以根据需要采用模拟传输方式或数字传输方式。
在模拟传输方式中,数据进入信道之前要经过调制,变换为模拟的调制信号。由千调制信号的频谱较窄,因此信道的利用率较高。模拟信号在传输过程中会衰减,还会受到噪声的干扰,如果用放大器将信号放大,混入的噪声也被放大了,这是模拟传输的缺点。在数字传输方式中,可以直接传输二进制数据或经过二进制编码的数据,也可以传输数字化了的模拟信号。因为数字信号只取有限个离散值,在传输过程中即使受到噪声的干扰,只要没有畸变到不可辨认的程度,就可以用信号再生的方法进行恢复,对某些数码的差错也可以用差错控制技术加以消除。所以,数字传输对千信号不失真地传送是非常有好处的。另外,数字设备可以大规模集成,比复杂的模拟设备便宜得多。然而,传输数字信号比传输模拟信号所要求的频带要宽得多,因而信道利用率较低。
2.2 信道特性
2 .2.1 信道带宽
模模拟信道的带宽如图 2-2 所示。信道带宽其中, _f1_是信道能通过的最低频率,_f2_是信道能通过的最高频率,两者都是由信道的物理特性决定的。当组成信道的电路制成了,信道的带宽就决定了。为了使信号传输中的失真小一些,信道要有足够的带宽。
数字信道是一种离散信道,它只能传送取离散值的数字信号。信道的带宽决定了信道中能不失真地传输的脉冲序列的最高速率。一个数字脉冲称为一个码元,用码元速率表示单位时间内信号波形的变换次数,即单位时间内通过信道传输的码元个数。若信号码元宽度为 T 秒,则码元速率 B=l/T。码元速率的单位叫波特 (Baud), 所以码元速率也叫波特率。早在 1924 年,贝尔实验室的研究员亨利·奈奎斯特 (Harry Nyquist) 就推导出了有限带宽无噪声信道的极限波特率,称为尼奎斯特定理。若信道带宽为 w, 则尼奎斯特定理指出最大码元速率为
奈奎斯特定理指定的信道容量也叫作奈奎斯特极限,这是由信道的物理特性决定的。超过奈奎斯特极限传送脉冲信号是不可能的,所以要进一步提高波特率必须改善信道带宽。码元携带的信息橘由码元取的离散值的个数决定。若码元取两个离散值,则一个码元携带1 位信息。若码元可取 4 种离散值,则一个码元携带两位信息。总之,一个码元携带的信息 量n (位)与码元的种类数 N 有如下关系
单位时间内在信道上传送的信息量(位数)称为数据速率。在一定的波特率下提高速率的途径是用一个码元表示更多的位数。如果把两位编码为一个码元,则数据速率可成倍提高。有公式
其中,R 表示数据速率,单位是每秒位 (bps 或 b/s) 。
数据速率和波特率是两个不同的概念。仅当码元取两个离散值时两者的数值才相等。对与普通电话线路,带宽为 3000Hz, 最高波特率为 6000Baud, 最高数据速率可随着调制方式的不同而取不同的值。这些都是在无噪声的理想情况下的极限值。实际信道会受到各种噪声的干扰,因而远远达不到按奈奎斯特定理计算出的数据传送速率。香衣 (Shannon) 的研究表明,有噪声信道的极限数据速率可由下面的公式计算
这个公式叫作香衣定理,其中, W 为信道带宽, S 为信号的平均功率, N 为噪声平均功率,S/N 叫作信噪比。由于在实际使用中 S 与 N 的比值太大,故常取其分贝数(dB) 。分贝与信噪比的关系为
例如,当 S/N=1000时,信噪比为 30dB 。这个公式与信号取的离散值的个数无关,也就是说,无论用
什么方式调制,只要给定了信噪比,则单位时间内最大的信息传输霾就确定了。例如,信道带宽为 3000Hz, 信噪比为 30dB, 则最大数据速率为
这是极限值,只有理论上的意义。实际上,在 3000Hz 带宽的电话线上数据速率能达到 9600bps就很不错了。
综上所述,有两种带宽的概念,在模拟信道,带宽按照公式 计算,例如 CATV 电缆的带宽为 600MHz 或 1000MHz; 数字信道的带宽为信道能够达到的最大数据速率,例如以太网的带宽为 10Mbps 或 100Mbps 。两者可互相转换。
2.2.2 误码率
在有噪声的信道中,数据速率的增加意味着传输中出现差错的概率增加。用误码率来表示传输二进制位时出现差错的概率。误码率可用下式表示
在计算机通信网络中,误码率一般要求低千 10-6, 即平均每传送 l 兆位才允许错 l 位。在误码率低于一定的数值时,可以用差错控制的办法进行检查和纠正。
2.2.3 信道延迟
信号在信道中传播,从源端到达宿端需要一定的时间。这个时间与源端和宿端的距离有关,也与具体信道中的信号传播速度有关。以后考虑的信号主要是电信号,这种信号一般以接近光速的速度 (300m/µs) 传播,但随传输介质的不同而略有差别。例如,在电缆中的传播速度一般为光速的 77%, 即 200m/µs 左右。
一般来说,考虑信号从源端到达宿端的时间是没有意义的,但对千一种具体的网络,我们经常对该网络中相距最远的两个站之间的传播时延感兴趣。这时除了要计算信号传播速度外,还要知道网络通信线路的最大长度。例如,500m 同轴电缆的时延大约是 2.5µs, 而卫星信道的时延大约是 270ms 。时延的大小对某些网络应用(例如交互式应用)有很大影响。
2.3 传输介质
计算机网络中可以使用各种传输介质来组成物理信道。这些传输介质的特性不同,因而使用的网络技术不同,应用的场合也不同。下面简要介绍各种常用的传输介质的特点。
2 .3 .1 双绞线
双绞线由粗约 1mm 的互相绝缘的一对铜导线绞扭在一起组成,对称均匀地绞扭可以减少线对之间的电磁干扰。这种双绞线大量使用在传统的电话系统中,适用千短距离传输,若超过几千米,就要加入中继器。在局域网中可以使用双绞线作为传输介质,如果选用高质量的芯线,采用适当的驱动和接收技术,安装时避开噪声源,在几百米之内数据的传输速率可达每秒几十兆位。
双绞线分为屏蔽双绞线和无屏蔽双绞线,如图 2-3 所示。常用的无屏蔽双绞线电缆 (Unshielded Twisted Pa ir , UTP) 由不同颜色的(橙、绿、蓝、棕) 4 对双绞线组成 。 屏蔽双绞线(Shielded Twisted Pair , STP) 电缆的外层由铝箱包裹着,价格相对高一些,并且需要支持屏蔽功能的特殊连接器和适当的安装技术,但是传输速率比相应的无屏蔽双绞线高。国际电气工业协会 (EIA)定义了双绞线电缆各种不同的型号,计算机综合布线使用的双绞线种类如表 2 - 1 所示 。
由千双绞线价格便宜,安装容易,适用千结构化综合布线,所以得到了广泛使用。 通常在局域网中使用的无屏蔽双绞线的传送速率是 lOMbps 或 lOOMbps, 随着 网卡技术的发展 , 短距离甚至可以达到 lOOOMbps 。
2.3.2 同轴电缆
同轴电缆的芯线为铜质导线,外包一层绝缘材料,再外面是由细铜丝组成的网状外导体,最外面加一层绝缘塑料保护层,如图 2-4 所示 。 芯线与网状导体同轴,故名同轴电缆 。 同轴电缆的这种结构,使它具有高带宽和极好的噪声抑制特性 。
在局域网中常用的同轴电缆有两种,一种是特性阻抗为 50.Q 的同轴电缆,用千传输数字信号,例如 RG-8 或 RG-11 粗缆和RG-58 细缆。粗同轴电缆适用千大型局域网,它的传输距离长,可靠性高,安装时不 需要切断电缆,用夹板装置夹在计算机需要连接的位置。但粗缆必须安装外收发器,安装难度大,总体造价高。细缆则容易安装,造价低,但安装时要切断电缆,装上BNC 接头,然后连接在 T 型连接器两端,所以容易产生接触不良或接头短路的隐患,这是以太网运行中常见的故障。
通常把表示数字信号的方波所固有的频带称为基带,所以这种电缆也叫基带同轴电缆,直接传输方波信号称为基带传输。由千计算机产生的数字信号不适合长距离传输,所以在信号进入信道前要经过编码器进行编码,变成适合千传输的电磁代码。经过编码的数字信号到达接收端,再经译码器恢复为原来的二进制数字数据。基带系统的优点是安装简单而且价格便宜,但由于在传输过程中基带信号容易发生畸变和衰减,所以传输距离不能太长。一般在 1 km 以内,典型的数据速率是 10Mbps 或100Mbps 。
常用的另一种同轴电缆是特性阻抗为 75.Q 的 CATV 电缆(RG-59), 用于传输模拟信号,这种电缆也叫宽带同轴电缆。所谓宽带,在电话行业中是指比 4kHz 更宽的频带,而这里是泛指模拟传输的电缆网络 。要把计 算机产生的比特流变成模拟信号在 CATV 电缆上传输,在发送端和接收端要分别加入调制器和解调器。采用适当的调制技术,一个 6MHz 的视频信道的数据速率可以达到 36Mbps 。通常采用频分多路技术 (FDM), 把整个 CATV 电缆的带宽 (1000MHz)划分为多个独立的信道,分别传输数据、声音和视频信号,实现多种通信业务。这种传输方式称为综合传输,适合于在办公自动化环境中应用。
宽带系统与基带系统的主要区别是模拟信号经过放大器后只能单向传输。为了实现网络节点间的相互连通,有时要把整个带宽划分为两个频段,分别在两个方向上传送信号,这叫分裂配置。有时用两根电缆分别在两个方向上传送,这叫双缆配置。虽然两根电缆比单根电缆的价格要贵一些(大约贵 15%), 但信道容量却提高 1 倍多。无论是分裂配置还是双缆配置都要使用一个叫作端头 (headend) 的设备。该设备安装在网络的一端,它从一个频率(或一根电缆)接收所有站发出的信号,然后用另一个频率(或电缆)发送出去。
宽带系统的优点是传输距离远,可达几十千米,而且可同时提供多个信道。然而和基带系统相比,它的技术更复杂,需要专门的射频技术人员安装和维护,宽带系统的接口设备也更昂贵。
2.3.3 光缆
光缆由能传送光波的超细玻璃纤维制成,外包一层比玻璃折射率低的材料。进入光纤的光
波在两种材料的界面上形成全反射,从而不断地向前传播,如图 2-5所示。
光纤信道中的光源可以是发光二极管 (Light Emitting Diode, LED) 或注入式激光 极管
(Injection Laser Diode, ILD) 。这两种器件在有电流通过时都能发出光脉冲,光脉冲通过光导纤
维传播到达接收端。接收端有一个光检测器 光电二极管,它遇光时产生电信号,这样就形
成了一个单向的光传输系统,类似于单向传输模拟信号的宽带系统。如果采用另外的互连方式,
把所有的通信节点通过光缆连接成一个环,环上的信号虽然是单向传播,但任一节点发出的信
息其他节点都能收到,从而也达到了互相通信的目的,如图2-6 所示。
光波在光导纤维中以多种模式传播,不同的传播模式有不同的电磁场分布和不同的传播路
径,这样的光纤叫多模光纤(如图 2-7(a) 所示)。光波在光纤中以什么模式传播,这与芯线和包
层的相对折射率、芯线的直径以及工作波长有关。如果芯线的直径小到光波波长大小,则光纤
就成为波导,光在其中无反射地沿直线传播,这种光纤叫单模光纤 (如图 2-7(b) 所示)。 模光纤比多模光纤的价格更贵。
光导纤维作为传输介质,其优点是很多的。首先是它具有很高的数据速率、极宽的频带、
低误码率和低延迟。数据传输速率可达1000Mbps, 甚至更高,而误码率比同轴电缆可低两个数量级,只有 。其次是光传输不受电磁干扰,不可能被偷听,因而安全和保密性能好。最后,光纤重量轻、体积小、铺设容易。
2.3.4 无线信道
前面提到的由双绞线、同轴电缆和光纤等传输介质组成的信道可统称为有线信道。这里要
讲到的信道都是通过空间传播信号,称之为无线信道。无线信道包括微波、红外和短波信道,
下面简略介绍这3种信道的特点。
微波通信系统可分为地面微波系统和卫星微波系统,两者的功能相似,但通信能力有很大
的差别。地面微波系统由视距范围内的两个互相对准方向的抛物面天线组成,长距离通信则需
要多个中继站组成微波中继链路。在计算机网络中使用地面微波系统可以扩展有线信道的连通
范围,例如在大楼顶上安装微波天线,使得两个大楼中的局域网互相连通,这可能比挖地沟埋
电缆的花费更少。
通信卫星可看作是悬在太空中的微波 中继站。卫星上的转发器把波束对准地球上的一定区
域,在此区域中的卫星地面站之间就可互相通信。 地面站以一定的频率段向卫星发送信息(称
为上行频段),卫星上的转发器将接收到的信号放大并变换到另一个频段上(称下行频段)发
回地面接收站。这样的卫星通信系统可以在一定的区域内组成广播式通信网络,特别适合千海
上、空中、矿山、油田等经常移动的工作环境。卫星传输供应商可以将卫星信道划分成许多子
信道出租给商业用户,用户安装甚小孔径终端系统 (VSAT) 组成卫星专用网,地面上的集中
站作为收发中心与用户交换信息
微波通信的频率段为吉兆段的低端,一般是 1~11GHz, 因而它具有带宽高、容 大的特
点。由千使用了高频率,因此可使用小型天线,便千安装和移动。不过微波信号容易受到电磁
干扰,地面微波通信也会造成相互之间的干扰,大气层中的雨雪会大量吸收微波信号,当长距
离传输时会使得信号衰减以至无法接收。另外,通信卫星为了保持与地球自转同步,一般停在
36 000km 的高空 这样长的距离会造成 240~280ms 的时延,在利用卫星信道组网时,这样长的时
延是必须考虑的因素。
最新采用的无线传输介质要算红外线了(如图 2-8 所示 )。红外传输系统利用墙壁或屋顶反射
红外线从而形成整个房间内的广播通信系统。这种系统所用的红外光发射器和接收器常见千电
视机的遥控装置中。红外通信的设备相对便宜 ,可获得高的带宽,这是这种通信方式的优点。
其缺点是传输距离有限,而且易受室 内空气状态(例如有烟雾等)的影响。
无线电短波通信早已用在计算机网络中了,已经建成的无线通信局域网使用了甚高频
C30~300MHz) 和超高频 (300~3000M应)的电视广播频段,这个频段的电磁波是以直线方
式在视距范围内传播的,所以用作局部地区的通信是适宜的。早期的无线电局域网(例如
ALOHA系统)是中心式结构一—有一个类似于通信卫星那样的中心站,每一个主机节点都把天
线对准中心站,并以频率Ji 向中 心站发送信息,这就是上行线路;中 心站向各主机节点发送信
息时采用另外一个频率儿进行广播,这叫下行线路。采用这种网络通信方式要解决好上行线路
中由千两个以上的站同时发送信息而发生冲突的问题。后来的无线电局域网采用分布式结构——没有中心站,节点机的天线是没有方向
的,每个节点机都可以发送或接收信息。这种
通信方式适合千由微机工作站组成的资源分
布系统,在不便千建设有线通信线路的地方可
以快速建成计算机网络。短波通信设备比较便
宜,便于移动,没有像地面微波站那样的方向
性,并且中继站可以传送很远的距离。但是,
这种情况容易受到电磁干扰和地形地貌的影
响,而且带宽比微波通信要小。
2.4 数据编码
二进制数字信息在传输过程中可以采用不同的代码,各种代码的抗噪声特性和定时功能各不相同,实现费用也不一样。下面介绍几种常用的编码方案,如图2-9所示。
1. 单极性码
在这种编码方案中,只用正的(或负的)电压表示数据。例如,在图 2-9 中用+3V 表示二
进制数字 "0", 用0V 表示二进制数字 "1" 。单极性码用在电传打字机 (TTY) 接口以及 PC与TTY 兼容的接口中,这种代码需要单独的时钟信号配合定时,否则,当传送一长串0或1时,发送机和接收机的时钟将无法定时,单极性码的抗噪声特性也不好。
2. 极性码
在这种编码方案中,分别用正电压和负 电压表示二进制数 "0" 和"1"。例如,在图 2-9 中用
+3V 表示二进制数字 "0", 用-3V 表示二进制数字 "1" 。这种代码的电平差比单极码大,因而抗干扰特性好,但仍然需要另外的时钟信号。
3. 双极性码
在双极性编码方案中,信号在3个电平(正、负、零)之间变化。一种典型的双极性码就
是所谓的信号交替反转编码 (Alternate Mark Inversion, AMI) 。在 AMI 信号中,数据流中遇到
"1"时使电平在正和负之间交替翻转 ,而遇到 "0" 时则保持零电平。双极性是三进制信号编
码方法,它与二进制编码相比抗噪声特性更好。 AMI 有其内在的检错能力,当正负脉冲交替出
现的规律被打乱时容易识别出来,这种情况叫AMI 违例 。这种编码方案的缺点是当传送长串"0"
时会失去位同步信息。对此稍加改进的一种方案是 "6 零取代“双极性码 B6ZS 即把连续 "0"
用一组代码代替。这一组代码中若含有 AMI 违例,便可以被接收机识别出来。
4. 归零码
在归零 (Return to Zero, RZ) 中,码元中间的信号回归到零电平,因此,任意两个码元
之间被零电平隔开。与以上仅在码元之间有电平转换的编码方案相比,这种编码方案有更好的
噪声抑制特性。因为噪声对电平的干扰比对电平转换的干扰要强,而这种编码方案是以识别电
平转换边来判别 "0" 和" I "信号的。图 2-9 中表示出的是一种双极性归零码。可以看出,从
正电平到零电平的转换边表示码元 "0 "'从负电平到零电平的转换边表示码元 "1 "'同时每
位码元中间都有电平转换,使得这种编码成为自定时的编码。
5. 双相码
双相码要求每一位中都要有一个电平转换。因而这种代码的最大优点是自定时,同时双相
码也有检测错误的功能,如果某一位中间缺少了电平翻转,则被认为是违例代码。
6. 不归零码
图2-9 中所示的不归零码 (Not Return to Zero, NRZ) 的规律是当" 1 "出现时电平翻转, 当"0" 出现时电平不翻转。因而数据 "1" "0" 的区别不是高低电平,而是电平是否转换。
这种代码也叫差分码,用在终端到调制解调器的接口中。这种编码的特点是实现起来简单而且费用低 ,但不是自定时的。
7.曼彻斯特编码
曼彻斯特编码 (Manchester Code) 是一种双相码。在图 2-9 中,用 高电平到低电平的转换
边表示 "0", 用低电平到高电平的转换边表示 "1 "'相反的表示也是允许的。位中间的电平转
换边既表示了数据代码,同时也作为定时信号使用。曼彻斯特编码用在以太网中。
8. 差分曼彻斯特编码
这种编码也是一种双相码,和曼彻斯特编码不同的是,这种码元中间的电平转换边只作为
定时信号,不表示数据。数据的表示在千每一位开始处是否有电平转换:有电平转换表示 "0",
无电平转换表示 "1" 。差分曼彻斯特编码用在令牌环网中。
从曼彻斯特码和差分曼彻斯特码的图形中可以看出,这两种双相码的每一个码元都要调制
为两个不同的电平,因而调制速率是码元速率的2倍。这对信道的带宽提出了更高的要求,所
以实现起来更困难也更昂贵。但由千其良好的抗噪声特性和自定时功能,在局域网中仍被广泛
使用。
9. 多电平编码
这种编码的码元可取多个电平之一,每个码元可代表几个二进制位。例如,令 M=2", 设M=4, 则n=2 。若表示码元的脉冲取4 个电平之 ,则一个码元可表示两个二进制位。与双相
码相反,多电平码的数据速率大千波特率,因而可提高频带的利用率。但是这种代码的抗噪声
特性不好,在传输过程中信号容易畸变到无法区分。
在数据通信中,选择什么样的数据编码要根据传输的速度、信道的带宽、线路的质量以及
实现的价格等因素综合考虑。
10. 4B/5B 编码
在曼彻斯特编码和差分曼彻斯特编码中,每位中间都有一次电平跳变,因此波特率是数据
速率的两倍。对千 100Mbps 的高速网络,如果采用这类编码方法,就需要 200 兆的波特率,其硬件成本是 100 兆波特率硬件成本的 5~10倍。
为了提高编码的效率,降低电路成本,可以采用 4B/5B 编码 这种编码方法的原理如图 2-10所示。
这实际上是一种两级编码方案 系统中使用不归零码,在发送到传输介质之前要变成见1就翻不归零码(NRZ-1) NRZ-1 代码序列中1的个数越多,越能提供同步定时信息,但如果遇
到长串的0, 则不能提供同步信息。所以在发送到介质之前还需经过一次 4B/5B 编码,发送器扫描要发送的位序列,4位分为一组, 然后按照表 2-2 的对应规则变换成5位的代码。
5位二进制代码的状态共有 32 种,在表2-2 中选用的5位代码中1的个数都不少千两个。这就保证了在介质上传输的代码能提供足够多的同步信息。另外,还有 8B/10B 编码等方法,其原理是类似的。
2.5 数字调制技术
数字数据不仅可以用方波脉冲传输,也可以用模拟信号传输。用数字数据调制模拟信号叫作数字调制。这一节讲述简单的数字调制技术。
可以调制模拟载波信号的3个参数——幅度、频移和相移来表示数字数据。在电话系统中
就是传输这种经过调制的模拟载波信号的。3种基本模拟调制方式如图2-11所示。
1. 幅度键控 (ASK)
按照这种调制方式,载波的幅度受到数字数据的调制而取不同的值,例如对应二进制 "0",
载波振幅为 "0"; 对应二进制 "1 "'载波振幅取 "1" 。调幅技术虽然实现起来简单,但抗干扰
性能较差
2. 频移键控 (FSK)
按照数字数据的值调制载波的频率叫作频移键控。例如,对应二进制 "0" 的载波频率为, 对应二进制 "1" 的载波频率为。这种调制技术的抗干扰性能好,但占用的带宽较大。在
有些低速调制解调器中,用这种调制技术把数字数据变成模拟音频信号传送。
3. 相移键控 (PSK)
用数字数据的值调制载波相位,这就是相移键控 。例如,用 180 相移表示 "1 ";用0相移表示0。这种调制方式抗干扰性能好,而且相位的变化也可以作为定时信息来同步发送机和接
收机的时钟。码元只取两个相位值叫2相调制,码元可取4个相位值叫4相调制。4相调制时,一个码元代表两位二进制数(如表 2-3 所示)。采用4相或更多相的调制能提供较高的数据速率,但实现技术更复杂。
可见,数字调制的结果是模拟信号的某个参量(幅度 、频率或相位)取离散值。这些值与
传输的数字数据是对应的,这是数字调制与传统的模拟调制不同的地方。
4 . 正交幅度调制
所谓正交幅度调制 (Quadrature Amplitude Modulation, QAM) 就是把两个幅度相同但相位相差90° 的模拟信号合成为一个模拟信号。表 2-4 的例子是把 ASK和PSK 技术结合起来,形
成幅度相位复合调制,这也是一种正交幅度调制技术。由千形成了 16 种不同的码元,所以每一个
码元可以表示4位二进制数据,使得数据速率大大提高。
2.6 脉冲编码调制
模拟数据通过数字信道传输时效率高、失真小,而且可以开发新的通信业务,例如,在数
字电话系统中可以提供语音信箱功能。把模拟数据转化成数字信号,要使用 叫作编码解码器
(Codec) 的设备。这种设备的作用和调制解调器的作用相反,它是把模拟数据(例如声音、图
像等)变换成数字信号,经传输到达接收端再解码还原为模拟数据。用编码解码器把模拟数据
变换为数字信号的过程叫模拟数据的数字化。常用的数字化技术就是脉冲编码调制技术 (Pul se
Code Modulation, PCM), 简称脉码调制。
2.6.1 取样
每隔一定的时间,取模拟信号的当前值作为样本,该样本代表了模拟信号在某一时刻的瞬
时值。一系列连续的样本可用来代表模拟信号在某一区间随时间变化的值。以什么样的频率取样,才能得到近似千原信号的样本空间呢?奈奎斯特取样定理告诉我们:如果取样速率大千模
拟信号最高频率的两倍,则可以用得到的样本空间恢复原来的模拟信号,即
其中,为取样频率, 为取样周期,为信号的最高频率。
2.6.2 量化
取样后得到的样本是连续值,这些样本必须量化为离散值,离散值的个数决定了量化的精度。在图 2-12 中,把量
化的等级分为 16 级,用 0000~1111 这16 个二进制数分别
代表 0.1 ~1.6 这 16 个不同的电平幅度。
2.6.3 编码
把量化后的样本值变成相应的二进制代码,可以得到相
应的二进制代码序列,其中每个二进制代码都可用一个脉冲串 (4 位)来表示,这4位一组的脉冲序列就代表了经 PCM 编码的模拟信号。
由上述脉码调制的原理可以看出,取样的速率是由模拟信号的最高频率决定的,而量化级
的多少则决定了取样的精度。在实际使用中,希望取样的速率不要太高,以免编码解码器的工
作频率太快;也希望量化的等级不要太多,能满足需要就行了,以免得到的数据量太大 ,所以
这些参数都取下限值。例如,对声音信号数字化时,由千话音的最高频率是 4kHz, 所以取样速率是8kHz 。对话音样本用 128 个等级量化,因而每个样本用7位二进制数字表示。在数字信道上
传输这种数字化了的话音信号的速率是 7 X 8000=56kbps 。如果对电视信号数字化,由于视频信
号的带宽更大 (6MHz), 取样速率就要求更高,假若量化等级更多,对数据速率的要求也就更
高了。、
2.7 通信方式和交换方式
2.7.1 数据通信方式
1. 通信方向
按数据传输的方向分,可以有下面 3 种不同的通信方式。
(1) 单工通信。在单工信道上,信息只能在一个方向传送,发送方不能接收,接收方也不能发送。信道的全部带宽都用千由发送方到接收方的数据传送。无线电广播和电视广播都是单 工通信的例子。
(2) 半双工通信。在半双工信道上,通信的双方可交替发送和接收信息,但不能同时发送 和接收。在一段时间内,信道的全部带宽用千在一个方向上传送信息,航空和航海无线电台以 及无线对讲机等都是以这种方式通信的。这种方式要求通信双方都有发送和接收能力,因而比 单工通信设备昂贵,但比全双工设备便宜。在要求不是很高的场合,多采用这种通信方式,虽 然转换传送方向会带来额外的开销。
(3) 全双工通信。这是一种可同时进行双向信息传送的通信方式,例如现代的电话通信就 是这样的。全双工通信不仅要求通信双方都有发送和接收设备,而且要求信道能提供双向传输 的双倍带宽,所以全双工通信设备最昂贵。
2. 同步方式
在通信过程中,发送方和接收方必须在时间上保持同步才能准确地传送信息。前面曾提到 过信号编码的同步作用,这叫码元同步。另外,在传送由多个码元组成的字符以及由许多字符 组成的数据块时,通信双方也要就信息的起止时间取得一致。这种同步作用有两种不同的方式, 因而对应了两种不同的传输方式。
(1) 异步传输。即把各个字符分开传输,字符之间插入同步信息。这种方式也叫起止式, 即在字符的前后分别插入起始位("0 ")和停止位(" l ")'如图 2-13 所示。起始位对接收方的 时钟起置位作用。接收方时钟置位后只要在 8~11 位的传送时间内准确,就能正确接收一个字 符。最后的停止位告诉接收方该字符传送结束,然后接收方就可以检测后续字符的起始位了。 当没有字符传送时,连续传送停止位。 加入校验位的目的是检查传输中的错误,一般使用奇偶校验。异步传输的优点是简单,但 是由千起止位和检验位的加入会引入 20%~30%的开销,传输的速率也不会很高。
(2) 同步传输。异步传输不适合于传送大的数据块(例如磁盘文件),同步传输在传送连 续的数据块时比异步传输更有效。按照这种方式,发送方在发送数据之前先发送一串同步字符 SYNC, 接收方只要检测到连续两个以上 SYNC 字符就确认已进入同步状态,准备接收信息。随后的传送过程中双方以同一频率工作(信号编码的定时作用也表现在这里),直到传送完指 示数据结束的控制字符。这种同步方式仅在数据块的前后加入控制字符 SYNC. 所以效率更高。 在短距离高速数据传输中,多采用同步传输方式。
2.7.2 交换方式
一个通信网络由许多交换节点互连而成。信息在这样的网络中传输就像火车在铁路网络中 运行一样,经过一系列交换节点(车站),从一条线路交换到另一条线路,最后才能到达目的 地。交换节点转发信息的方式可分为电路交换、报文交换和分组交换 3 种。
1. 电路交换
这种交换方式把发送方和接收方用一系列链路直接连通(如图 2-14 所示)。电话交换系统 就是采用这种交换方式。当交换机收到一个呼叫后就在网络中寻找一条临时通路供两端的用户 通话,这条临时通路可能要经过若干个交换局的转接,并且一旦建立连接就成为这一对用户之 间的临时专用通路,其他用户不能打断,直到通话结束才拆除连接。
早期的电路交换机采用空分交换技术。图 2-15 表示由 n 条全双工输入输出线路组成的纵 横交换矩阵,在输入线路和输出线路的交叉点处有接触开关。每个站点分别与一条输入线路和 一条输出线路相连,只要适当控制这些交叉触点的通断,就可以控制任意两个站点之间的数据 交换。这种交换机的开关数拯与站点数的平方成正比,成本高,可靠性差,已经被更先进的时 分交换技术取代了。
时分交换是时分多路复用技术在交换机中的应用。图 2-16 所示为常见的 TOM 总线交换, 每个站点都通过全双工线路与交换机相连,当交换机中的某个控制开关接通时该线路获得一个 时槽,线路上的数据被输出到总线上。在数字总线的另一端按照同样的方法接收各个时槽上的 数据。
电路交换的特点是建立连接需要等待较长的时间。由千连接建立后通路是专用的,因而不 会有其他用户的干扰,不再有等待延迟。这种交换方式适合千传输大量的数据,传输少量信息 时效率不高。
2. 报文交换
这种方式不要求在两个通信节点之间建立专用通路。节点把要发送的信息组织成一个数据 包——报文,该报文中含有目标节点的地址,完整的报文在网络中一站一站地向前传送。每一 个节点接收整个报文,检查目标节点地址,然后根据网络中的“交通情况”在适当的时候转发 到下一个节点。经过多次的存储—转发,最后到达目标节点(如图 2-17 所示),因而这样的网 络叫存储-转发网络。其中的交换节点要有足够大的存储空间(一般是磁盘),用于缓冲接收到 的长报文。交换节点对各个方向上收到的报文排队,寻找下一个转发节点,然后再转发出去, 这些都带来了排队等待延迟。报文交换的优点是不建立专用链路,线路是共享的,因而利用率 较高,这是由通信中 的等待时延换来的 。
3. 分组交换
在这种交换方式中数据包有固定的长度,因而交换节点只要在内存中开辟一个小的缓冲区 就可以了。在进行分组交换时,发送节点先要对传送的信息分组,对各个分组编号,加上源地 址和目标地址以及约定的分组头信息,这个过程叫作信息的打包。一次通信中的所有分组在网 络中传播又有两种方式,一种叫数据报 (Datagram), 另一种叫虚电路 CVntualC江cuit), 下面分别 介绍。
(I) 数据报。类似千报文交换,每个分组在网络中的传播路径完全是由网络当时的状况随 机决定的。因为每个分组都有完整的地址信息,如果不出意外都可以到达目的地。但是,到达 目的地的顺序可能和发送的顺序不一致。有些早发的分组可能在中间某段交通拥挤的链路上耽 搁了,比后发的分组到得迟,目标主机必须对收到的分组重新排序才能恢复原来的信息。 一般 来说,在发送端要有一个设备对信息进行分组和编号,在接收端也要有一个设备对收到的分组 拆去头、尾并重排顺序,具有这些功能的设备叫分组拆装设备 (PacketAssembly and Disassembly device, PAD), 通信双方各有一个。
(2) 虚电路。类似千电路交换,这种方式要求在发送端和接收端之间建立一条逻辑连接。 在会话开始时,发送端先发送建立连接的请求消息,这个请求消息在网络中传播,途中的各个 交换节点根据当时的交通状况决定取哪条线路来响应这一请求,最后到达目的端。如果目的端 给予肯定的回答,则逻辑连接就建立了。以后发送端发出的一系列分组都走这一条通路,直到 会话结束,拆除连接。 与电路交换不同的是,逻辑连接的建立并不意味着其他通信不能使用这 条线路,它仍然具有链路共享的优点。
按虚电路方式通信,接收方要对正确收到的分组给予回答确认,通信双方要进行流晕控制 和差错控制,以保证按顺序正确接收,所以虚电路意味着可靠的通信。当然, 它涉及更多的技 术,需要更大的开销。也就是说,它没有数据报方式灵活,效率不如数据报方式高。
虚电路可以是暂时的,即会话开始建立,会话结束拆除,这叫作虚呼叫;也可以是永久的, 即通信双方一开机就自动建立连接,直到一方请求释放才断开连接,这叫作永久虚电路。
虚电路适合于交互式通信,这是它从电路交换那里继承的优点。数据报方式更适合于单向 地传送短消息,采用固定的、短的分组相对千报文交换是一个重要的优点。除了交换节点的存 储缓冲区可以小一些外,也带来了传播时延的减小。分组交换也意味着按分组纠错,发现错误 只需重发出错的分组,使通信效率提高。广域网络一般都采用分组交换方式,按交换的分组数 收费,而不是像电话网那样按通话时间收费,这当然更适合计算机通信的突发式特点。有些网络同时提供数据报和虚电路两种服务,用户可根据需要选用。
2.8 多路复用技术
多路复用技术是把多个低速信道组合成一个高速信道的技术。这种技术要用到两个设备, 其中,多路复用器 (Multiplexer) 在发送端根据某种约定的规则把多个低带宽的信号复合成一 个高带宽的信号;多路分配器 (Demultiplexer) 在接收端根据同一规则把高带宽信号分解成多 个低带宽信号。多路复用器和多路分配器统称多路器,简写为 MUX, 如图 2-18 所示。
只要带宽允许,在已有的高速线路上采用多路复用技术可以省去安装新线路的大笔费用, 因而现今的公共交换电话网 (PSTN) 都使用这种技术,有效地利用了高速干线的通信能力。
当然,也可以相反地使用多路复用技术,即把一个高带宽的信号分解到几个低速线路上同 时传输,然后在接收端合成为原来的高带宽信号。例如,两个主机可以通过若干条低速线路连 接,以满足主机间高速通信的要求。
2.8.1 频分多路复用
频分多路复用是在一条传输介质上使用多个频率不同的模拟载波信号进行多路传输,这些 载波可以进行任何方式的调制,如 ASK、 FSK、 PSK 以及它们的组合。每一个载波信号形成了 一个子信道,各个子信道的中心频率不相重合,子信道之间留有一定宽度的隔离频带(如图 2-19 所示)。
频分多路技术早已用在无线电广播系统中,在有线电视系统 (CATV) 中也使用频分多路 技术。一根 CATV 电缆的带宽大约是 1 000MHz, 可传送多个频道的电视节目,每个频道 6.5MHz 的带宽中又划分为声音子通道、视频子通道以及彩色子通道。每个频道两边都留有一定的苦戒 频带,防止相互串扰。
FDM 也用在宽带局域网中。电缆带宽至少要划分为不同方向上的两个子频带,甚至还可以 分出一定带宽用千某些工作站之间的专用连接。
2.8.2 时分多路复用
时分多路复用 CT皿e Division Multiplexing, TDM) 要求各个子通道按时间片轮流地占用 整个带宽(如图 2-20 所示)。时间片的大小可以按一次传送一位、一个字节或一个固定大小的 数据块所需的时间来确定。
时分多路技术可以用在宽带系统中,也可以用在频分制下的某个子通道上。时分制按照子 通道的动态利用情况又可分为两种,即同步时分和统计时分。在同步时分制下,整个传输时间 被划分为固定大小的周期。每个周期内,各子通道都在固定位置占有一个时槽。这样,在接收 端可以按约定的时间关系恢复各子通道的信息流。当某个子通道的时槽来到时,如果没有信息 要传送,这一部分带宽就浪费了 。 统计时分制是对同步时分制的改进,特别把统计时分制下的 多路复用器称为集中器,以强调它的工作特点。在发送端,集中器依次循环扫描各个子通道。 若某个子通道有信息要发送则为它分配一个时槽,若没有就跳过,这样就没有空槽在线路上传 播了。然而,需要在每个时槽加入一个控制字段,以便接收端可以确定该时槽是属千哪个子通 道的。
2.8.3 波分多路复用
波分多路复用 (Wave Division Multiplexing, WDM) 使用在光纤通信中,不同的子信道用 不同波长的光波承载,多路复用信道同时传送所有子信道的波长。这种技术在网络中要使用能 够对光波进行分解和合成的多路器, 如图 2-21 所示。
2.8.4 数字传输系统
在介绍脉码调制时曾提到,对 4kHz 的话音信道按 8kHz 的速率采样, 128 级量化,则每个 话音信道的比特率是 56kbps。为每一个这样的低速信道安装一条通信线路太不划算了,所以在 实际中要利用多路复用技术建立更高效的通信线路。在美国和日本使用很广的一种通信标准是 贝尔系统的飞载波(如图 2-22 所示)。
载波也叫一次群,它把 24 路话音信道按时分多路的原理复合在一条 l.544Mbps 的高速信 道上。该系统的工作是这样的,用一个编码解码器轮流对 24 路话音信道取样、量化和编码, 将一个取样周期中 (125µs) 得到的 7 位一组的数字合成一串,共 7X24 位长。这样的数字串在 送入高速信道前要在每一个 7 位组的后面插入一个信令位,千是变成了 8X24==192 位长的数字 串。这 192 位数字组成一帧,最后再加入一个帧同步位,故帧长为 193 位。每 125µs 传送一帧, 其中包含了各路话音信道的一组数字,还包含了总共 24 位的控制信息以及 1 位帧同步信息。 这样,不难算出飞载波的各项比特率。对每一路话音信道来说,传输数据的比特率为 7b/125µs== 56 kbps, 传输控制信息的比特率为 1b/125µs==8 kbps, 总的比特率为 193 b/125µs=l.544 Mbps。
载波还可以多路复用到更高级的载波上,如图 2-23 所示。 4 个 1.544 Mbps 的信道结 合成 1 个6.312Mbps 的信道,多增加的位 (6.312-4X 1.544=0.136) 是为了组帧和差错恢复。与此类似, 7 个信道组合成 1 个信道, 6 个信道组合成 1 个信道。
ITU-T 的 El 信道的数据速率是 2.048Mbps C如图 2-24 所示)。这种载波把 32 个 8 位一组 的数据样本组合成125µs 的基本帧,其中 30 个子信道用千话音传送数据,两个子信道 (CHO 和 CH16) 用于传送控制信令,每 4 帧能提供 64 个控制位。除了北美和亚洲的日本外, El 载 波在其他地区得到了广泛使用。
按照 ITU-T 的多路复用标准, E2 载波由 4 个 El 载波组成,数据速率为 8.448Mbps。 E3 载波由 4 个 E2 载波组成,数据速率为 34.368Mbps。 E4 载波由 4 个 E3 载波组成,数据速率为 139.264Mbps。 E5 载波由 4 个 E4 载波组成,数据速率为 565.148Mbps。
2.8.5 同步数字系列
光纤线路 的 多 路复用标准有两个, 美 国标准叫作同步光纤网络 (Synchronous Optical Network, SONET); ITU-T 以 SONET 为基础制订出的国际标准叫作同步数字系列 (Synchronous Digital Hierarchy, SDH) 。 SDH 的基本速率是 155.52Mbps, 称为第 1 级同步传递模块 ( Synchronous Transfer Module), 即 STM-L 相当于 SONET 体系中的 OC-3 速率,如表 2-5 所示。
2.9 差错控制
无论通信系统如何可靠,都不能做到完美无缺。因此, 必须考虑怎样发现和纠正信号传输 中 的差错。 这一节从应用角度介绍差错控制的基本原理和方法。
通信过程中出现的差错可大致分为两类: 一类是由热噪声引起的随机错误;另一类是由冲 击噪声引起的突发错误。 通信线路中的热噪声是由电子的热运动产生的,香衣关千噪声信道传 输速率的结论就是针对这种噪声的。 热噪声时刻存在,具有很宽的频谱,且幅度较小。通信线路的信噪比越高,热噪声引起的差错越少。这种差错具有随机性,影响个别位。
冲击噪声源是外界的电磁干扰,例如打雷闪电时产生的电磁干扰,电焊机引起的电压波动 等。冲击噪声待续的时间短而幅度大,往往引起一个位串出错。根据它的特点,称其为突发性 差错。
此外,由千信号幅度和传播速率与相位、频率有关而引起的信号失真,以及相邻线路之间 发生串音等都会产生差错,这些差错也具有突发性的特点。
突发性差错影响局部,而随机性差错总是断续存在,影响全局。所以要尽量提高通信设备 的信噪比,以满足要求的差错率。此外,要进一步提高传输质量,就需要采用有效的差错控制 办法。这一节介绍的检错和纠错码只是可靠性技术中的一种,它广泛地使用在数据通信中。
2.9.1 检错码
奇偶校验是最常用的检错方法,其原理是在 7 位的 ASCII 代码后增加一位,使码字中 1 的 个数成奇数(奇校验)或偶数(偶校验)。经过传输后,如果其中一位(甚至奇数个位)出错, 则接收端按同样的规则就能发现错误。这种方法简单实用,但只能对付少量的随机性错误。
为了能检测突发性的位串出错,可以使用校验和的方法。这种方法把数据块中的每个字节 当作一个二进制整数,在发送过程中按模 256 相加。数据块发送完后,把得到的和作为校验字 节发送出去。接收端在接收过程中进行同样的加法,数据块加完后用自已得到的校验和与接收 到的校验和比较,从而发现是否出错。实现时可以用更简单的办法,例如在校验字节发送前, 对累加器中的数取 2 的补码。这样,如果不出错,接收端在加完整个数据块以及校验和后累加 器中是 0。这种方法的好处是由千进位的关系,一个错误可以影响到更高的位,从而使出错 位对校验字节的影响扩大了。可以粗略地认为,随机的突发性错误对校验和的影响也是随机 的。出现突发错误而得到正确的校验字节的概率是 1/256, 于是就有 255 : 1 的机会能检查出任 何错误。
2.9.2 海明码
1950 年,海明 (Hamming) 研究了用冗余数据位来检测和纠正代码差错的理论和方法。按 照海明的理论,可以在数据代码上添加若干冗余位组成码字。码字之间的海明距离是一个码字 要变成另一个码字时必须改变的最小位数。例如, 7 位 ASCII 码增加一位奇偶位成为 8 位的码 字,这 128 个 8 位的码字之间的海明距离是 2。所以,当其中一位出错时便能检测出来。两位 出错时就变成另外一个码字了。
海明用数学分析的方法说明了海明距离的几何意义, n 位的码字可以用 n 维空间的超立方体的一个顶点来表示。两个码字之间的海明距离就是超立方体的两个对应顶点之间的一条边, 而且这是两顶点(两个码字)之间的最短距离,出错的位数小千这个距离都可以被判断为就 近的码字。这就是海明码纠错的原理,它用码位的增加(因而通信量增加)来换取正确率的 提高。
按照海明的理论,纠错码的编码就是要把所有合法的码字尽蜇安排在 n 维超立方体的顶点 上,使得任意一对码字之间的距离尽可能大。
如果任意两个码字之间的海明距离是 d, 则所有 小千等千 d-1 位的错误都可以检查出来,所有小千 d/2 位的错误都可以纠正。一个自然的推论 是,对于某种长度的错误串,要纠正它就要用比仅仅检测它多一倍的冗余位。 如果对千 m 位的数据增加 k 位冗余位,则组成 n=m+k 位的纠错码。对千 2m个有效码字中 的每一个,都有 n 个无效但可以纠错的码字。这些可纠错的码字与有效码字的距离是 1, 含单 个错误位。这样,对千一个有效的消息总共有 n+l 个可识别的码字。这 n+l 个码字相对于其他 2m-1 个有效消息的距离都大千 1 。这意味着总共有 2m (n+l)个有效的或者可纠错的码字。显然, 这个数应小于等于码字的所有可能的个数,即 2飞千是,有
因为,得出
对千给定的数据位 m, 上式给出了 K 的下界,即要纠正单个 错误 K 必须取的最小值。海明建议了一种方案可以达到这个下界, 并能直接指出错在哪一位。首先把码字的位从 1 到 n 编号,并把 这个编号表示成二进制数,即 2 的幕之和 。然后对 2 的每一个幕 设置一个奇偶位。例如,对千 6 号位,由千 6=110 (二进制),所 以 6 号位参加第 2 位和第 4 位的奇偶校验,而不参加第 1 位的奇 偶校验。类似地, 9 号位参加第 1 位和第 8 位的校验而不参 加第 2 位或第 4 位的校验。海明把奇偶校验分配在 1 、 2、 4、 8 等位置上,其他位放置数据。 下面根据图 2-25 举例说明编码的 方法。
假设传送的信息为 1001011, 把各个数据放在 3、 5、 6、 7、 9、 10、 11 等位置上, 1、 2、 4、 8 位留作校验位。
根据图 2-25, 3、 5、 7、 9、 11 的二进制编码的第一位为 1, 所以 3、 5、 7、 9、 11 号位参加第 1 位校验,若按偶校验计算, 1 号位应为 1 。
如果这个码字传输中出错,比如说 6 号位出错,即变成:
当接收端按照同样的规则计算奇偶位时,发现 l 和 8 号位的奇偶性正确, 2 和 4 号位的奇 偶性不对,于是 2+4= 6, 立即可确认错在 6 号位。
在上例中, k=4, 因而 m<24- 4 - I= 1 L 即数据位可用到 11 位,共组成 15 位的码字,可检 测出单个位的错误。
2.9.3 衍环冗余校验码
所谓循环码是这样一组代码,其中任一有效码字经过循环移位后得到的码字仍然是有效 码字,不论是右移或左移,也不论移多少位。例如,若是有效码字,则等都是有效码字。循环冗余校验码 ( Cyclic Redundancy Check, CRC) 是一种循环码,它有很强的检错能力,而且容易用硬件实现,在局域网中有广 泛应用。
首先介绍 CRC 怎样实现,然后对它进行一些数学分析,最后说明 CRC 的检错能力。 CRC 可以用图 2-26 所示的移位寄存器实现。移位寄存器由 K 位组成,还有几个异或门和一条反馈回 路。图 2-26 所示的移位寄存器可以按 CCITT-CRC 标准生成 16 位的校验和。寄存器被初始化 为 O, 数据从右向左逐位输入。当一位从最左边移出寄存器时就通过反馈回路进入异或门和后 续进来的位以及左移的位进行异或运算。 当所有 m 位数据从右边输入完后再输入 k 个 0 (本例 中 k=l6)。最后,当这一过程结束时,移位寄存器中就形成了校验和。 K位的校验和跟在数据位 后边发送,接收端可以按同样的过程计算校验和并与接收到的校验和比较,以检测传输中的差错。
以上描述的计算校验和方法可以用一种特殊的多项式除法进行分析。 m 个数据位可以看作 阶多项式的系数。例如,数据码字 00101011 可以组成的多项式是。图 2-26 中表 示的反馈回路可表示成另外一个多项式 , 这就是所谓的生成多项式。所有的运算都 按模 2 进行,即
显然,在这种代数系统中,加法和减法一样,都是异或运算。用 x 乘一个多项式等千把多 项式的系数左移一位。 可以看出,按图 2-26 的反馈回路把一个向左移出寄存器的数据位反馈回 去与寄存器中的数据进行异或运算,等同于在数据多项式上加上生成多项式,因而也等同千从 数据多项式中减去生成多项式。以上给出的例子,对应千下面的长除法:
得到的校验和是 9509H。千是看到,移位寄存器中的过程和以上长除法在原理上是相同的, 因而可以用多项式理论来分析 CRC 代码,这就使得这种检错码有了严格的数学基础。
把数据码字形成的多项式叫数据多项式 , 按照一定的要求可给出生成多项式 。用除可得到商多项式和余多项式,实际传送的码字多项式是
由于使用了模 2 算术,, 于是接收端对 计算的校验和应为 0。如果有差错, 则接收到的码字多项式包含某些出错位 , 可表示成
由于可以被整除,如果不能被整除,则说明, 即有错误出现。 然而,若也能被 整除,则有差错而检测不到 。
数学分析表明, 应该有某些简单的特性,才能检测出各种错误。例如,若包含的 项数大于1, 则可以检测单个错;若 含有因子 , 则可检测出所有奇数个错。最后得出的最重要的结论是:具有个校验位的多项式能检测出所有长度小于等于 的突发性差错。
为了能对不同场合下的各种错误模式进行校验,已经研究出了几种 CRC 生成多项式的国际 标准。
CRC-CCITT
CRC-16
CRC-12
CRC-32
其中, CRC-32 被用在许多局域网中。