- VOLTE下行时延解读
3GPP TS 23.203 给出了标准QCI 的特性。对QCI 为1 的VoIP 语音和QCI 为5 的IMS信令的时延需求,PDB(Packet Delay Budget)均为100ms,也就是对UE 到PGW(Protocol Gate Way)之间的时延要求为100ms,为具有98%满意度的最大时延。
QCI业务配置表
23.203中的Packet Delay是UE和PCEF之间的时延
分组时延预算定义为UE何PCEF之间的分组传输时延上限,无线接口(eNode B 与 UE之间)的分组时延需要PDB减去一个值,该值取决于UE与PCEF间距离场景,根据VOLTE容量要求eNODEB到UE之间的空口时延为50ms.
网管用户面下行时延统计为从收到PDCP SDU到PDCP SDU成功发送之间所经历的时长,累加统计周期内所有的PDCP数据包时延,用总时延与该周期内成功发送的PDCP数据包总数之比表示平均值,每个QCI类型对应一个子测量项。
成功发送定义为收到UE对PDCP SDU的最后一个分片的ACK确认,具体为UM模式下为MAC层ACK;AM模式下为RLC层ACK。(3GPP TS 32.425)。
- VOLTE高下行时延指标情况
龙岩中兴区域下行QCI 1平均时延在25ms,提取15天指标观察相对稳定,具体如下:
提取15天中兴区域小区用户面下行时延(QCI 1)指标分析,共4827个频次大于20ms,其中41个小区时延大于100ms,并且只重复出现5个;50ms<x<100ms有39个小区,并且只重复出现1个,如下:
小区用户面下行时延(QCI 1)
根据上图可知,现网TOP高时延(大于50ms)小区重复率极低,根据原始数据查询,只在某个15分钟粒度突发高时延导致整体平均时延过高,且大于50ms 15天只出现80个,目前全网小区用户面下行时延整体较好。
Ø TOP小区情况:
提取全天小区用户面下行平均时延(QCI=1)大于25小区10个作为试点小区,从关联指标看现阶段VOLTE用户数较少,容量方面因素暂不考虑,主要还是从无线环境、参数两个维度着手分析。
3. VOLTE高下行时延原因分析
从原理上来看,数据是以TB块的形式传输,当MAC层收到某个SDU的所有TB块HARQ后作为一个统计节点,当无线链路质量差,可能导致误块率过高,过多的重传增加TB块的成功HARQ的时间,导致时延增大;另当调度的用户数或者数据量过多,而每个TTI调度的用户数有限,对用户数据的调度必然滞后,所以调度算法、调度资源等都会对时延产生影响;
影响时延的几个关键因素:
(1) 信道质量:如果测试时UE所处环境的信道质量不好,则会对解调性能造成一定的影响,这样有可能造成错包或者丢包,进而影响时延结果。
(2) HARQ重传:如果数据包在传输过程中出现了错误或者丢失(触发原因可能因为瞬时信号质量变化使得较高的MCS无法解调正确),那么会触发HARQ重传,直到数据包接收正确为止。因此,信道质量越差,重传次数越多,时延也就越大。
(3) 调度方式:由于不同调度方式的流程间存在区别,会对时延造成影响,如半静态调度与动态调度,预调度与非预调度等。
3.1 无线环境方面
关于无线信道质量方面的问题,目前可根据MRS、MRO、网管相关性能指标进行关联,主要从覆盖、干扰、容量、参数等方面来关联分析,相关流程如下:
根据流程对龙岩3月份全月下行用户面时延(QCI 1)大于25ms的小时级分析,现网TOP高时延小区重复率极低,只在某个15分钟粒度突发高时延导致整体平均时延过高,造成时延差的因素不只是单方面的因素,很大一部分都是由于综合因素造成时延比较大,很难从后台某一项性能指标去进行归类分析;就是对某一个小区的不同时间段,由于用户的分布位置,空口质量,业务量,用户数量等等也会造成时延偏差比较大,很难定性的去分析。
举例:
Ø 下行时延与低CQI占比分析:
根据时延及CQI四象限,CQI低于30%的情况下时延长的采样点也较多。
下行时延与低CQI占比分析
Ø 小时级时延与MAC层误块率分析:
根据小时级时延与MAC层误块率分析,主要分布在二、三象限,即使误块率较低情况下时延仍有较长的情况出现。
下行时延与MAC层误块率分析
3.2 算法参数方面
ü 相关关键参数方面核查:
目前现网实际参数取值与规范相符,部分参数仍有调整空间。
discardTimer(qci1)—现网无穷大
该定时器伴随上行传输,即控制数据包上传的一个定时器,每一个PDCP SDU对应一个discardTimer。当UE从上层接收到PDCP SDU时,开始启动该SDU对应的定时器。当该定时器超时或者已经通过PDCP状态报告确认将相应PDCP SDU传到下层时,UE需要将PDCP SDU以及相应的PDCP PDU丢弃。UE高层要求数据承载对应的RLC非确认模式下进行PDCP进行重建立时,在重建之前没发出的PDCP SDU不需要重新触发discardTimer。
因此,该定时器如果设置过小,对于PDCP重建成功有一定影响,会影响丢包率,而设置过大,则容易过多的占用PDCP层的资源,影响后续包的发送时延。
现网PDCP包丢弃定时器(QCI1)设置为永久大,此参数可设置范围为100ms 、300ms、500ms 750ms 1500ms无穷大,有调整空间。
HARQ 重传最大次数—5次
信道质量越差,重传次数越多,时延也就越大,规范值设置为<=5,有调整空间,将通过调整重传次数研究时延的变化。
ü 算法功能开启方面核查
预调度:预调度可以减少调度等待时间。
预调度:调度器始终为其分配资源,不需要调度请求(Scheduling Request)。详见下图(a)
非预调度:在首包到达之后调度器再为其分配资源。UE要通过调度请求来初始化这一流程。详见下图(b)
TTI Bundling–现网关闭
TTI Bundling 功能 (Transmission Time Interval) 可以提高上行传输成功率,应用场景包括VOIP业务等。TTI Bundling 功能通常在远点很低的 SINR下被激活,大幅提高小区的覆盖范围。在远点时,普通调度通常会有很高的HARQ传输失败,而TTI Bundling可以减少BLER和传输失败导致的延时。对于小区边界的某些UE而言,其最大发射功率较低,重传的次数可能过多而导致VoIP业务的延迟超过50 ms。
中兴VOLTE新技术文档中提到只有FDD和TDD configuration 0/1/6,才支持TTI bundling。对于其它4种TDD configuration,由于一个系统帧内的上行子帧数小于4个,所以不支持TTI bundling。
DRX-----现网开启
DRX(Discontinuous Reception)即非连续接收,是指UE仅在必要的时间段打开接收机进入激活期,以接收下行数据和信令,而在其他时间关闭接收机进入休眠期,停止接收下行数据和信令的一种节省UE电力消耗的工作模式。
在DRX工作模式下,DRX周期包含激活期和休眠期,UE的工作状态对应为激活态和休眠态;在非DRX工作模式下,UE将一直打开接收机,保持激活态。
- 优化方案研究验证
本专项选取主城区时延较高的10个小区,并结合RF、参数调整实验对时延提升效果。实验方案如下:
4.1 实验方案1
(1)方案:DRX短不连续接收循环周期长度(SF)由40修改为20。
(2)实施时间:3月28日23:00
(3)方案实施前后对比:
QCI 1的短不连续接收循环周期长度40修改为20后,QCI 1小时级时延由25ms下降至20ms左右
4.2 实验方案2
(1)方案:关闭DRX,中兴只区分GBR业务与非GBR业务DRX使能开关,此次实验关闭GBR业务DRX(switchForGbrDrx)。
(2)实施时间:3月30日23:00
(3)方案实施前后对比:
DRX关闭后平均时延处于18ms左右,部分时段达到15ms以内,相对实验前减少8ms左右时延。
4.3 实验方案3
(1)方案:discardTimer(qci1)参数由无穷大修改为100ms,HARQ重传次数修改为3。
(2)实施时间:3月31日23:00
(3)方案实施前后对比:
修改后时延较修改前变化不大,平均时延仍处于18ms左右,根据前期实验对突发高时延有一定效果。
- 实验结论
目前VOLTE用户数还较少,现网TOP高时延小区重复率低,只在某个15分钟粒度突发高时延造成整体平均时延过高,导致进行分析时关联性不足。
本次实验通过DRX周期修改、关闭DRX,整体下行平均时延由25ms优化至17ms左右,有8ms左右增益,修改PDCP丢包定时器后突发高时延现象有所减少。