低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

NR 演进之路

1.2.3 高移动性需求的实现

1.2.4 低时延需求的实现

NR 要求实现毫秒级的用户面端到端时延,理想情况下端到端时延为 1ms,典型端到端时延约为 5~10 ms。注意此处对端到端时延的定义是,数据分组从离开源节点的应用层开始,直至抵达并被目标节点的应用层成功接收所经历的时间长度。也即,端到端时延包含了多段路径的传输时延以及对应转发节点的处理时延。
典型 NR 网络架构的端到端时延由空口、前传、中传和回传多段路径的传输时延,以及 UE、AAU、CU、DU 和 5GC 设备各个节点的处理时延相加而成,如图 1-16 所示。因此,NR 实现低时延需要一系列技术的有机结合,而不能仅仅针对某一局部的时延进行单独的优化。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

1.低时延的基本约束
为简化分析,可将 NR 的端到端时延视由空口时延、承载网时延和核心网时延 3 段组成。
核心网时延主要是指核心网网元设备的处理时延,具体与设备的集中计算能力和处理能力等有关。实际上,此处出于简化的目的,还规避了对核心网到应用服务器的时延讨论,而这主要取决于核心网到服务器的传输距离。由于网络自身结构的复杂性,对网元设备处理时延的优化难以对端到端时延起到量变的作用。因而,对核心网时延的优化更多的是关注核心网的“去中心化”,将核心网分离部署,使用户平面简化下沉,数据存储和计算功能下移到网络边缘,从而降低时延。
承载网时延与传输距离以及承载设备的处理能力密切相关。对于光传送网而言,光在媒介中的传播时间与光速、距离和折射率相关,即有

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

其中,n 为光纤群折射率,一般取值在 1.467~1.468(1310~1550 nm)。c 为光速,L 为传输距离。可见,在传输距离一定的条件下,光纤传输时延无法优化。而对于承载设备节点的处理时延,目前一般为 20~50 μs 量级,当优化到10 μs 以内或更低时,进一步优化的必要性已经不强。因此,对于承载网时延,其基本约束是源节点到目的节点的距离,以及传输路由中的转发节点数量。
相比于核心网时延和承载网时延,空口时延的优化空间相对较大。以 LTE为例,图 1-17 和图 1-18 分别示出了 LTE 的上行传输时延和下行传输时延,不包括重传时延。上下行传输时延主要由以下几个部分组成。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

  • 调度请求。UE 在发送数据前须先发送调度请求(SR,Scheduling Requst),在收到 eNodeB 的调度授权(SG,Scheduling Grant)并得到上行传输资源后,UE 才可以向 eNodeB 端发送数据分组。此处产生的时延是,UE 必须严格等待下一个 PUCCH 资源才能够发送 SR;eNodeB 收到 SR 控制信息,引入了 SR 解码时延;eNodeB 经过调度和分配资源,决定允许用户进行上行传输并反馈 SG;
    UE 收到 SG 相应引入了 SG 解码时延,然后才可以在 PUSCH 传输上行数据。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

  • 随机接入。如果 UE 上行定时未对齐,则需要通过随机接入来进行初始的定时对齐。eNodeB 通过向 UE 发送定时提前命令来完成定时对齐,但是经过一个去激活周期,可能会停止发送定时提前命令,因此,在 RRC 连接态下,随机接入的周期也会影响到时延。随机接入过程也可以用于发送 SR,此时不需要
    PUCCH 资源发送 SR。
  • TTI(Transmission Time Interval)。LTE 的各种信令(包括请求、调度)以及数据传输,都是基于 1 ms 的子帧,因此,TTI 是 UE 和 eNodeB 间每个分组交换时延的来源。
  • 处理时延。UE 和 eNodeB 需要对数据和控制信令进行处理,例如调制、解调。数据的处理时延(Processing Time)和传输块(TB,Transport Block)的大小正相关,而控制信令的处理时延与 TB 的大小没有太大关系。
  • HARQ RTT。对于 LTE FDD,在上行方向,n 子帧发送的数据在 n+4 子帧进行 HARQ 反馈,在 n+8 子帧进行重传,因此,上行 HARQ RTT 为 8 ms;在下行方向,由于采用异步重传,RTT 未详细规定,n 子帧发送的数据可以在n+4 子帧进行 HARQ 反馈,在 n+8 或者之后的子帧进行重传。对于 LTE TDD,HARQ RTT 和 TDD 的配置有关,这是由于在 TDD 中,上下行子帧的数目是不连续的,也并非一一对应的关系。例如,eNodeB 在 n 子帧接收到错误数据后,在 n+4 子帧的位置可能不存在下行子帧,因而 eNodeB 需要多等待一段时间,才有可能调度到相应的下行 HARQ 进程。

1-3 和表 1-4 给出了在不考虑重传时延的条件下,LTE(R8/R9)典型的上下行空口时延。当 SR 调度周期为 10 ms 时,上行传输时延平均为 17 ms;当SR 调度周期为 5 ms 时,上行传输时延平均为 12.5 ms,下行传输时延平均为7.5 ms。由此也可见,LTE 用户面传输时延远远超过 NR 毫秒级的低时延要求。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

由上述 LTE 上下行传输时延的分析可知,数据传输资源请求等待时间、数据传输时长、数据处理时间以及反馈时间都是影响空口时延的主要因素,可针对物理层和 MAC 层协议进行优化,获取较大的时延性能提升。
2.低时延的实现思路
结合前面的讨论,低时延的实现需要一系列有机结合的技术应用,一方面尽可能地减少转发节点,并缩短源节点到目的节点的距离;另一方面通过底层协议的优化大幅度降低空口传输时延。针对前者,主要有边缘计算、核心网功能下沉、CU/DU 分离等解决思路;针对后者,则提出了时隙聚合、EAI 机制、上下行异步 HARQ 等技术方案。
(1)边缘计算。
在不考虑空口时延、多重汇聚和转发时延以及拥塞和抖动等的前提下,即网络内部时延为 0 时,根据式(1-17)可知,数据分组在 1 ms 端到端时延的条件限制下,往返的最大传输距离不能超过 100 km。这仅仅相当于地市级别的调度范围,而将核心网功能和应用服务器整体下沉至市区一级明显不够现实。因而,NR 必须考虑让用户就近访问的方法。多接入边缘计算(MEC,Multi-AccessEdge Computing)通过在无线接入网侧部署通用服务器,为无线接入网提供 IT和云计算能力,使业务本地化、用户就近访问的诉求具备了实现条件。
以视频监控和智能分析场景为例,如图 1-19 所示。传统网络中视频监控的所有数据都需要回传到网络服务器,而监控视频的回传流量通常较大,且大部分画面是静止不动或无价值的。这种方式往往计算量大、耗费资源且往返时延较长。而通过在基站侧部署 MEC 服务器并加载视频管理应用,可将捕捉到的视频流进行转码和就地保存,以节省传输资源。同时,视频管理应用还可对视频内容进行分析和处理,对监控画面有变化的片段或者出现预配置事件的片段进行回传,计算量大幅减少。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

(2)核心网功能下沉。
与 MEC 下沉的思路相对应,核心网功能也要求尽可能在地理位置上靠近用户。NR 核心网可以进一步将控制面功能(CPF)和用户面功能(UPF)分离,统一的 CPF 部署在省干或大区的核心机房或数据中心(DC,Data Center),实现集中管控运营,分布式的 UPF 则根据业务需求,分布式部署在省干核心 DC、本地 DC 或者边缘 DC。其中,部署在边缘 DC 的 UPF 可以与 MEC 平台融合,进行本地分流,以满足低时延业务的需求。
(3)CU/DU 分离。
将 NR BBU 功能重构为集中单元(CU,Centralized Unit)和分布单元(DC,Distributed Unit)两个功能实体,如图 1-20 所示。CU 和 DU 功能的切分通过处理内容的实时性进行区分。CU 主要负责非实时性的无线高层协议栈功能,同时也支持部分核心网功能下沉和边缘应用业务的部署。而 DU 主要处理实时性要求较高的物理层和层二功能。
在低时延业务场景下,DU 可以下沉部署,甚至与 AAU 合设,实现实时性功能的本地化处理。
上述几类方案主要是针对回传时延的解决思路,如前所述,空口时延的优化空间相对更大。但是空口时延的降低是一个系统性工程,可以考虑从缩短 TTI以减小等待及响应时延、增强 HARQ 以降低可能的重传时延、简化控制信道以降低 UE 解码复杂度从而减小处理时延等方面进行组合优化。以下仅简要介绍几类关键技术、调度策略或优化机制。
(4)时隙聚合。
相对 LTE 每毫秒每子帧调度一次的机制(TTI =1 ms),NR 引入了时隙聚合(Slot Aggregation)机制,即在 NR 中的调度周期可以灵活变动,且一次可以调度多个时隙,以适应不同的业务需求,降低无线传输时延,如图 1-21 所示。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

(5)EAI 机制。
当 NR 多业务,尤其是 eMBB 和 uRLLC 业务共存时,必须设计合理的资源复用机制以保证 uRLLC 的实时可靠传输。
我们注意到,eMBB 业务由于数据分组通常较大,传输速率要求高,通常采用较大的时域调度单元进行数据传输。而 uRLLC 数据分组较小,且为了保证超短时延传输的要求,通常采用较小的时域调度单元。因此,eMBB 和 uRLLC业务共存时,uRLLC 的业务特性会影响空口资源的分配方式。如果采用预占资源的方式为 uRLLC 分配资源,则由于 uRLLC 的突发传输和小数据分组特性,在大部分无 uRLLC 数据传输的周期,会造成极大的资源浪费。如果采用频分复用的方式为 uRLLC 分配资源,则由于 eMBB 和 uRLLC 业务的时域调度粒度差异很大,会造成资源分配复杂度的提高。
鉴于上述原因,NR 采用了 EAI(Embed Air Interface)机制来实现 uRLLC业务对 eMBB 所占用资源的打孔,借此保障 uRLLC 对时延的敏感要求。如图 1-22 所示,当 uRLLC 业务数据到达 gNB 时,如果此时无可调度的空闲时频资源,由于 uRLLC 业务对时延敏感,无法等待 eMBB 正常传输完成后再进行调度,此时 gNB 会对当前已分配给 eMBB 业务的时频资源的部分或者全部进行打孔,交由 uRLLC业务进行数据传输。一旦 eMBB 资源被打孔,gNB 会通过抢占指示(PI,Preemption Indication)通知对应的 UE,以免 UE 将该时频资源上的数据全部接收,并且由于接收数据中含有 uRLLC 用户数据而造成译码错误,进而导致重传。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

需特别说明的是,上述的 EAI 机制目前仅对下行 eMBB 和 uRLLC 业务共存场景适用。对于上行 eMBB 和 uRLLC 业务共存场景,R15 暂时未予以支持,需要在后续演进的版本进一步研究。
(6)异步 HARQ。
在 LTE 中,上行链路采用同步 HARQ,如图 1-23 所示,可以使用自适应或非自适应模式。下行链路采用自适应的异步 HARQ,如图 1-24 所示。

低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五
低时延需求的实现 | 带你读《5G 空口设计与实践进阶 》之五

同步 HARQ 是指 HARQ 进程号不需要传输,依据时间关系接收端即可判断出相应的进程号。异步 HARQ 是指一个 HARQ 进程的传输可以发生在任意时刻,接收端预先不知道传输的发生时刻,因此,HARQ 进程的处理序号需要连同数据一起发送。相对同步 HARQ,异步 HARQ 信令开销较大,但是为调度和资源分配提供了更多的灵活性。
自适应 HARQ(Adaptive HARQ)意味着可以改变重传所使用的 PRB 资源以及调制与编码策略(MCS,Modulation and Coding Scheme)。非自适应 HARQ(Non-adaptive HARQ)意味着重传必须与前一次传输(新传或前一次重传)使用相同的 PRB 资源和 MCS。
在 NR 中,为了缩短重传时延,上下行链路均采用自适应的异步 HARQ 机制。这样,gNB 可以根据 MCS 灵活选择 HARQ 调度。例如,对于靠近 gNB 且时延敏感的用户,可以选择上下行单 TTI 调度,以减少等待重传的时间。而对于远离 gNB 且上行发射功率受限的用户,可以选择下行单 TTI、上行多 TTI 聚合进行调度,以提高传输的可靠性。
除上述讨论的方案外,NR 还通过灵活自适应的 Numerology、自包含时隙、上行免调度传输等机制的设计来实现空口时延的缩短,具体内容将在后续章节讨论。

1.2.5 大连接需求的实现

上一篇:广覆盖需求的实现 | 带你读《5G 空口设计与实践进阶 》之三


下一篇:被时代“甩掉”的SaaS!下一个新突破点在哪?