End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

<<频谱数据的端到端学习:频谱监测应用中无线信号识别的深度学习方法>>

Abstract

这篇论文介绍了端到端学习频谱数据——基于深神经网络的频谱监测应用中的新复杂无线信号识别方法的伞术语。

端到端学习允许(本文方案的优点):

  1. 直接从简单的无线信号表示中自动获取特征,而不需要设计手工制作的专家特征,如高阶循环矩
  2. 训练无线信号分类器端到端步骤,消除了复杂的多阶段机器学习处理信道的需求。

本文的目的是提出了一个端到端学习应用于频谱监测的概念框架,并且系统的引入了一个通用的方法能够简单的设计和实现无线信道分类。另外我们还调查了无线数据表示方式的选择在各种频谱监测任务中的重要性。(三种表示方法:IQ,幅度相位、频域表示)

具体是从两方面来研究的:

  1. 调制识别
  2. 无线技术干扰检测

对于每个案例研究,针对以下无线信号表示对三个卷积神经网络进行评估:时间IQ数据幅度/相位表示和频域表示。

通过我们的分析,我们证明了无线数据表示的准确性取决于需要区分的无线信号的特殊性和相似性,不同的数据表示会导致结果不准确,误差达到29%。实验结果表明,与IQ和频域数据相比,使用幅度/相位表示来识别调制格式可以在中到高信噪比下分别提高2%和12%的性能。对于检测干扰的任务,频域表示优于幅度/相位和IQ数据表示,最高可达20%。

introduction

背景:
无线网络目前正在经历一场戏剧性的演变。观察到的一些趋势是随着频谱需求的增加,无线设备的数量和多样性不断增加。

出现的问题:
不幸的是,无线电频谱是一种稀缺资源。因此,频谱的特定部分被大量使用,而其他部分[1]被严重未利用。例如,未经许可的频段被过度利用,并受到跨技术干扰[2]。

监测和了解频谱资源的使用情况,将成为5G提高和规范无线电频谱利用的重要资产,这是无可争辩的。然而,在如此复杂的无线系统中监测频谱使用需要在一个较宽的频率范围内进行分布式感知,从而导致无线电频谱数据泛滥[3]。从大量复杂的光谱数据中提取有意义的光谱使用信息需要复杂和先进的算法。

这为新的创新频谱接入方案和新的识别机制的发展铺平了道路,这些机制将提供对无线电环境的感知。例如,技术识别、调制类型识别和干扰源检测对干扰缓解策略至关重要,以继续有效利用稀缺的频谱资源,并使异构无线网络能够共存。

解决方法:
在本文中,我们研究了基于频谱数据的端到端学习,以此作为一种统一的方法来解决下一代无线网络面临的频谱管理、利用率和监管效率低下的问题。

无论目标是识别一种技术或一种特定的调制类型,识别干扰源或无干扰的频率通道,我们认为,各种问题可以被视为一般问题类型,我们称之为无线信号识别,这是机器学习分类技术的一个自然目标。端到端这一术语意味着提取无线信号特征和学习无线信号分类器的过程由一个单一的学习过程组成。更一般的,端到端学习是指在处理架构中,将输入(即感知的无线信号的数据表示)连接到期望的输出(即预测的信号类型)的整个管道完全从数据[4]中学习。

A 本文贡献(contributions)
本文全面介绍了利用频谱数据进行端到端学习的方法。本文的主要贡献如下:

  1. 确定了频谱监控的潜在端到端学习用例。特别地,提出了两个类别。第一类是需要检测频谱机会和频谱共享的用例,例如在认知无线电和新兴认知物联网中;第二类是需要检测无线电辐射源的用例,例如频谱调节
  2. 为了对这一跨学科主题做一个初步的背景介绍,我们简要介绍了机器学习/深度学习,并讨论了它们在频谱监测中的作用。然后,定义了适用于频谱监测应用的深度学习参考模型。
  3. 提出了端到端学习的概念性框架,并对用于无线信号分类任务的收集频谱数据、设计无线信号表示、形成训练数据和训练深度神经网络的方法进行了全面的概述。
  4. 为了验证该方法,对两个案例进行了实验:(I)调制识别和(Ii)无线技术干扰检测,这两个案例展示了无线数据表示形式的选择对所给结果的影响。对于调制识别,考虑以下调制技术:BPSK(二进制相移键控)、QPSK(正交相移键控)、m-PSK(相移键控,对于m=8)、m-QAM(正交幅度调制,对于m=16和64)、CPFSK(连续相移键控)、GFSK(高斯频移键控)和m-PAM(对于m=4的脉冲幅度调制)。在无线技术识别方面,分析了在非授权频段运行的三种有代表性的技术:IEEE802.11b/g、IEEE802.15.4和IEEE802.15.1。

论文的其余部分组织如下。第一节的其余部分介绍了相关工作。第二节介绍了建议方法的激励方案。第三节介绍了与机器学习/深度学习相关的基本概念,最后介绍了它们应用于频谱监测场景的高级处理流水线。第四部分介绍了无线信号分类的端到端学习方法。在第五节中,将该方法应用于两个场景,并对实验结果进行了讨论。第六节讨论了与未来端到端频谱管理系统的实施和部署相关的开放挑战。第七部分为结束语。

B Related work(contributions)

(1)传统的信号识别
以前在无线通信中与信号识别相关的研究主要基于用于通信的信号处理工具,例如循环平稳特征检测,有时还结合传统的机器学习技术(例如支持向量机(SVM-support vector machines)、决策树、k近邻(k-NN)、神经网络(NNS)等)。事实证明,这些专门解决方案的设计非常耗时,因为它们通常依赖于手动提取需要大量领域知识和工程的专家特征。

(2)把深度学习应用于信号分类
受深度学习,特别是卷积神经网络(CNN)在图像识别、语音识别和机器翻译[8]等一系列问题上的最新进展和显著成功的推动,无线通信工程师最近使用类似的方法来改进无线网络中信号识别任务的技术水平。该领域的先驱之一是O‘Shea等人。[9],他证明了在时域同相和正交(IQ)数据上训练的CNN显著优于传统的基于专家特征的自动调制识别方法(例如基于循环矩的特征)和传统的分类器(例如决策树、k-NNS、支持向量机、NNS和朴素贝叶斯)。
Selim等人。[10]提出用幅相差数据训练CNN分类器,使其能够高精度地检测雷达信号的存在。Akeret等人。[11]提出了一种精确检测射电天文学中射频干扰的新技术,该技术通过对从射电望远镜获取的2D时域数据对CNN进行训练来精确地检测射电天文学中的射频干扰。施密特等人。[12]提出了一种使用基于频域数据训练的CNN来识别非许可频段中的干扰的新方法[12]。多种无线技术(例如数字视频广播(DVB)、全球移动通信系统(GSM)、长期演进(LTE)等)。在[13]中使用对平均幅度快速傅立叶变换(FFT)数据的深度学习进行了高精度的分类。
这些个人的工作集中在特定的深度学习应用与无线信号分类使用特定的数据演示。他们没有提供详细的必要方法来理解如何将相同的方法应用到其他潜在的用例,他们也没有提供足够的信息作为选择无线数据表示的指南。这些信息对于那些想要复制现有尝试、在此基础上构建或产生新的应用程序想法的人来说是必要的。

(3)深度学习应用于无线网路
最近,O 'Shea和Hoydis[14]概述了深度学习在无线通信中的应用现状和未来的潜力。Y ao等人提出了一个统一的移动感知数据深度学习框架。然而,这些研究都没有关注频谱监测场景和训练无线信号分类器的基础数据模型。
为了弥补这些不足,本文提出了基于频谱数据的端到端学习:一种深度学习框架,用于统一解决频谱监测应用中的各种无线信号分类问题。据我们所知,本文是第一个详细阐述(I)采集、转换和表示频谱数据的方法,(Ii)设计和实现用于无线信号识别问题的数据驱动的深度学习分类器的方法,以及(Iii)同时研究不同分类问题的几种数据表示方法的第一篇综合性工作。本文描述的技术方法是深度跨学科和系统化的,需要计算机科学家、无线通信工程师、信号处理和机器学习专家的专业知识协同作用,最终目的是开拓新的领域,提高人们对这一新兴跨学科研究领域的认识。最后,本文恰逢其时,(I)机器学习领域的最新进展,(Ii)用于加速训练的计算进步和并行化,以及(Iii)提供大量光谱数据的努力,为新的光谱监测解决方案铺平了道路。
(4)Notation和术语

  1. 下文中,用普通字体表示标量值变量(如 x or X)。
  2. 矩阵就使用粗体大写表示 X
  3. 向量使用粗体小写字母来表示x,另外其有时可能表现为矩阵的行向量或列向量(即xk是第k列向量)
  4. 另外()T表示对矩阵或者向量转置
  5. ()*表示复数的共轭
  6. End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)表示向量x的Lp范数。

II. 频谱数据端到端学习的特征用例

频谱数据的端到端学习是一种新方法,可以直接从简单的无线信号表示自动学习功能,而无需设计手工制作的专家功能,如高阶循环时刻。术语端到端是指学习过程可以在一个端到端步骤中训练无线信号分类器的事实,这消除了对复杂的多级专家机学习处理信道(管道)的需求。

在深入进入频谱数据的端到端学习的概念之前,我们首先考虑图1的架构,其中两个激励情景说明了所提出的方法的特征使用情况。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
A.检测光谱机会和频谱共享

  1. 认知无线电(cognitive Radio)
    不断增长的无线电频谱需求加上目前占主导地位的固定频谱分配政策[16],激发了认知无线电(CR)和动态频谱访问(DSA)的概念,旨在改善无线电频谱的利用。CR网络(CRN)是一种智能无线通信系统,能够感知其无线电环境,即频谱机会,并通过与环境[17]交互和学习,智能地适应其工作参数。通过这种方式,CRN可以推断频谱占用率来识别未被占用的频带(空白/频谱洞),并以机会主义的方式与许可用户(主要用户(PU-primary users))共享它们。
    图1a)显示了数据驱动的CRN的基本操作过程。首先,CR用户间歇性地感知其周围的无线电环境,并通过控制信道将其感知结果报告给附近的基站(BS)。然后,BS将请求转发到后端数据中心(DC),该后端数据中心将来自多个CR用户的众包感知信息组合到频谱图中。DC推断频谱使用以确定PU(一种特征无线信号)的存在,并将频谱可用性信息扩散回认知用户。为此,DC首先基于感测报告离线学习CNN模型,然后使用该模型来区分频谱空洞和占用的频率信道。
  1. 认知物联网
    物联网(IoT)范式设想了一个设备/物体/事物“始终连接”到互联网的世界。在这个世界上,各种各样的无线技术和标准在未经许可的频段上运行,这给可用的频谱带来了巨大的压力。不断增长的无线频谱需求带来了共存、交叉技术干扰和无干扰频谱、稀缺等通信挑战。为了应对这些挑战,最近的研究工作提出了基于cr的物联网,以实现异构无线网络之间的动态频谱共享。
    图1 a)描述了这种情况。可以看出,CR-IoT设备配备了认知功能,允许它们搜索无干扰频谱,并相应地重新配置其传输参数。首先,CR-IoT设备向基于cnn的DC发送频谱传感报告。然后,直流学习和估计其他发射器的存在,并使用该信息来检测干扰源和无干扰信道。这使得能够与CR、遗留技术和调制类型共存的智能和有效的干扰缓解和频谱管理策略成为可能。

B.频谱管理政策和法规

频谱规管机构持续监测无线电频谱的使用,以防止用户受到有害干扰,并使其得到最佳使用。干扰可能是未经授权的排放、电磁干扰(EMI)和超出技术规格的设备的结果。为了解决与无线干扰相关的问题,频谱管理人员传统上使用工程分析和从频谱测量中获得的数据相结合。然而,在当今“无线富足”的时代,各种服务和无线技术共享同一个频段,识别未经授权的发射机是非常困难的。需要更智能的算法来自动挖掘频谱数据和识别干扰源。

图1b)给出了一个基于CNN的频谱管理框架,用于频谱管理。部署的传感器设备(例如{S1、S2、S3})收集频谱测量结果,并将其观测结果提供给DC以创建干扰图。DC使用信号处理技术和CNN模型来挖掘获得的频谱数据并识别现有的干扰源。挖掘的模式是确保遵守国家和国际频谱管理法规的关键。

III. 深度学习在频谱监测中的作用

本节有两个目标。首先介绍了机器学习/深度学习的关键思想。第二是推导用于频谱监测、管理和频谱调控的机器学习/深度学习应用的参考模型。

A. machine learning(机器学习)

机器学习(ML)指的是一组从历史数据中学习统计模型的算法。获得的模型是数据驱动的,而不是使用领域知识显式派生的。

ML的目标是找到一个数学函数f,它定义了一组输入X和一组输出Y之间的关系,即。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
每一对(xi,yi)被称为一个训练例子,因为它被用来训练或教学习算法如何获得f。
在机器学习中,f被称为预测器,它的任务是根据xi的输入值预测结果。根据预测类型的不同,有两种经典的数据模型,描述如下:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
简而言之,当输出变量y为连续或定量时,学习问题为回归问题。但是,如果y预测一个离散的或分类的值,它是一个分类问题。

给定一个训练集S,机器学习算法的目标是学习的数学模型。为了理解这个任务,我们假设存在一个固定但未知的分布,p(x,y) = pX(x)p(y|x),根据这个分布,数据样本是完全独立分布的(i.i.d)。这里,pX(x)是模拟输入点抽样的不确定性的边际分布,而p(y|x)是描述输入和输出之间统计关系的条件分布。
因此,f是一个固定但未知的函数,它定义了X和y之间的关系。描述的ML算法决定了函数的形式或形状。将所选的学习方法应用于训练数据S,估计出未知函数f,使f对于新的未见数据是一个很好的估计器,即。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
预测器f由向量θ∈Rn参数化,并且描述参数模型。在该设置中,估计f的问题归结为估计参数θ=[θ1,θ2,……,θn]T
在大多数实际应用中,观察到的数据是在理想情况下获得的期望值的损坏版本。这些不可避免的缺陷,通常被称为噪声,妨碍了从观测中提取真正的参数。在这方面,通用数据模型可以表示为
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中f(X)是模型和e是相加的测量误差和其他差异。最大似然法的目标是找到与噪声观测“最佳”匹配的输入-输出关系。因此,矢量θ可以通过求解(凸)优化问题来估计。

首先,设置损失或成本函数l(x,y,θ),其是对观测数据点Ye和模型预测ˆf(Xi)之间的误差的(逐点)测量,用于θ的每个值。

然而,θ是基于整个训练数据S来估计的,而不仅仅是一个例子。对于该任务,计算称为训练损失J的所有训练示例的平均损失:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中,S表示在来自训练集的实例上计算误差,并且i=1,.。。。,m。最小化训练损失J(θ)的向量θ,即End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
会给出想要的模型。一旦估计了模型,对于任何给定的输入x,就可以用ˆy=θTx对y进行预测。
在工程术语中,估计模型参数的过程称为系统辨识[43],该模型是输入和输出观测之间的映射。系统识别或最大似然分类技术非常适合于无线信号识别问题。

B. Deep learning(深度学习)
最大似然模型的预测精度在很大程度上取决于用于训练的数据表示或特征的选择。因此,在设计ML模型时,很多工作都放在预处理和数据转换链的组合上,这些链产生的数据表示可以支持有效的ML预测。非正式地,这被称为功能工程。特征工程是利用人类的聪明才智和先前的专家知识来提取、组合和处理特征的过程,也就是说,特征工程是利用人类的聪明才智和先前的专家知识来获得更具代表性的特征的过程
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
即,特征提取器φ将数据矢量D_∈_RD变换为更适合于进行预测的新形式x_∈_Rn。特征工程的重要性突出了机器学习算法的瓶颈:它们无法自动从数据中提取可区分的信息。
F特征学习是机器学习的一个分支,它将学习的概念从“学习模型(机器学习)”转变为“学习特征(深度学习)”。

卷积神经网络通过一系列嵌套层的非线性转换来实现特征学习。输入数据是一个多维数据数组,称为张量,显示在可见层。这是一种典型的类似网格的拓扑结构,例如,时间序列数据,可以看作是一个按一定时间间隔采样的一维网格,二维布局的图像中的像素,三维结构的视频,等等。然后通过一系列隐含层提取出若干抽象特征。这些层是“隐藏”的,因为它们的值没有给出。相反,深度学习模型必须确定哪些数据表示对于解释观察数据中的关系是有用的。每一层都由几个对输入执行卷积的内核组成;因此,它们也被称为卷积层。内核是特性检测器,它对输入进行卷积,并在输出时产生数据的转换版本。这是一组有限脉冲响应滤波器就像在信号处理中看到的,只是在一层一层学的。滤波器通常是多维参数数组,学习算法[24]通过反向传播的训练过程来学习这些参数。

例如,给定一个二维输入x,一个二维核h通过
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
即它们的权重与它们在输入中连接到的小区域之间的点积。
在卷积之后,添加偏置项并施加逐点非线性g,在滤波器输出处形成特征映射。如果我们将给定卷积层处的第l个特征映射表示为h1,其滤波器由系数或权重w1、输入x和偏置bl确定,则如下获得特征映射hl
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中∗是由公式12定义的2D卷积,而g(·)是激活函数。通常,整流器激活函数用于CNN,其定义为g(X)=max(0,x)。使用整流器的核被称为RELU(整流线性单元),并且已经证明与其他激活函数相比,在训练过程中可以极大地加速收敛。其他常见的激活函数是双曲正切函数(TANH),还有就是sigmoid函数。

为了更丰富地表示输入信号,通常会将多个滤波器进行叠加,使每个隐藏层由多个特征映射组成,{h(l),l = 0,…,L}(例如,L = 64,128, . .,等)。每层过滤器的数量是一个可调参数或超参数。其他可调参数包括过滤器大小、层数等。为超参数选择值可能是相当困难的,发现它通常是一门艺术,因为它是科学。一个最佳的选择只能通过反复试验才能实现,过滤器的大小是根据输入数据的大小来选择的,这样就有了合适的粒度级别,可以以适当的规模创建抽象。
例如,对于2平方矩阵输入,如光谱图,常见的选择有3×3、5×5、9×9等。对于宽矩阵,例如无线信号的复数I和Q样本的实值表示
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
合适的滤波器尺寸可以是1 × 3、2 × 3、2 × 5等。

CNN的倒数第二层由与前一层的所有特征地图完全相连的神经元组成。因此,这些层被称为完全连接层或致密层。最后一层是Softmax分类器,它计算K个类别上每个类别标签的后验概率为
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
也就是说,在输出层计算的分数(也称为logit)被转换为概率。在最后一个完全连通的层上计算损失函数l,该损失函数测量估计的概率ˆyi和真实类别标签的一次热编码yi之间的差值。CNN参数θ是通过最小化大小为m的训练集{xi,yi}i∈Ss上的损失函数来获得的,
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中l(.)。通常是均方误差l(y,ˆy)=ky−ˆyk2或分类交叉熵l(y,ˆy)=pm i=1yilog(ˆyi),其前面通常加上负号以获得负的对数似然率。
为了控制过拟合,通常使用正则化与丢弃相结合,这是一种新的非常有效的技术,它“丢弃”了一层中的一组随机激活。每个单元都保留有固定的概率p,通常使用验证集选择,或者设置为0.5,这对于广泛的应用来说是接近最佳的[25]。

C.从光谱数据进行深度学习

智能能力在未来无线通信系统的发展中将是至关重要的,使它们能够观察、学习和响应其复杂和动态的操作环境。图2显示了用于在来自频谱数据设置的端到端学习中使用深度学习来实现智能行为的处理流水线。管道包括:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

  1. 数据采集
    数据是设计未来智能无线网络的关键资产(asset)。为了获得频谱数据,无线电首先通过从各个频段收集原始数据来感知环境。原始数据由N个样本组成,这些样本堆叠成表示接收到的无线信号的复包络的数据向量Rk。这些数据向量是端到端学习的输入,以获得可以推断无线信号存在的模型。
  2. 数据预处理
    数据预处理是对采集到的频谱数据进行分析和处理,目的是得到潜在的良好的无线数据表示。在前一块中组织成数据向量的原始样本被流水线作为信号处理(SP)工具的输入,信号处理(SP)工具分析、处理和变换数据以得到简单的数据表示,例如频率、幅度、相位和频谱,或者更复杂的特征Xk,例如循环平稳特征。此外,可以利用诸如深度学习之类的特征学习来自动提取更低级别和更高级别的特征。在许多ML应用程序中,特性的选择即使不比ML算法的选择更重要,也同样重要。
  3. 分类(classification)
    “分类”处理块使智能能力能够通过检测无线信号的存在来评估环境无线电环境。这可能是正在利用频谱的发射器的类型(频谱接入方案、调制格式、无线技术等)、干扰类型、检测可用频带等。我们将此过程称为频谱学习[27]。在未来的无线网络中,最大似然算法可能会在无线信号的自动分类方面发挥关键作用,作为迈向智能频谱接入和管理方案的一步。
  4. 决策(decision)
    由ML模型计算的预测被用作决策模块的输入。在CR应用中,决策可能与最佳传输策略(例如频带或传输功率)有关,该最佳传输策略将最大化数据速率而不会对其他用户造成干扰。这个过程被称为频谱判决[18]。在CR-IoT的上下文中,该决定可能涉及干扰缓解策略,例如在特定时间段内的后退。在诸如频谱监管的其他通信场景中,该决定可能涉及应用于检测到的有害干扰源(例如,假GSM塔、红色接入点等)的频谱策略或频谱合规性强制执行。

IV. 数据驱动的端到端学习无线信号分类

下一代(5G)无线网络有望了解动态变化的无线环境的多样特性和可用频谱的波动特性,从而自主确定最佳系统配置或支持频谱调节。

本节介绍一个数据驱动的端到端学习框架,用于未来5g网络的频谱监控应用。首先,介绍了用于数字通信的无线信号的表示方法和用于无线信号采集的数据模型。然后,提出了一种用于特征提取、训练数据创建和无线信号分类器设计的数据模型。其中,深度学习可用于提取无线信号的低级和高级特征,并用于无线信号的分类。

A. WIRELESS SIGNAL MODE
无线通信系统通过一种称为信道的无线媒介将信息从一点传送到另一点。在系统级,无线通信模型由以下部分组成:

  1. TRANSMITTER(发射机)
    发射机将信息源所产生的信息,即比特流,转换为在无线信道上传输的适当形式。图3显示了发送端处理链。首先,通过编码技术将比特bk∈{0,1}映射为一个新的二进制序列。所得到的序列被映射到一个可能是实数或复数的字母表或星座中的符号sk。这个过程叫做调制。在调制步骤中,所创建的符号通过脉冲整形滤波器映射到离散波形或信号,并发送到数字到模拟转换器模块(D/ a),在该模块中,波形被转换为模拟连续时间信号sb(t)。产生的信号是一个基带信号,通过载波频率fc移位频率来产生由定义的无线信号s(t):
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    其中s(t)为中心频率fc的实值带通信号
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    Sb (t)是s(t)的基带复包络线。
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
  2. WIRELESS CHANNEL(无线信道)
    无线信道的特点是信道强度随时间和频率的变化。变化被建模为(i)大规模的衰落,这描述信道的路径损耗的函数距离和阴影等大型对象建筑和山,和(2)小规模衰落模型建设性和破坏性干扰的多个发射机和接收机之间的传播路径。信道效应可以用复杂有限脉冲响应(FIR)滤波器h(t, τ)描述为线性时变系统。若r(t)是通道输出的信号,则输入/输出关系为:
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    式中,h(t, τ)为带限带通信道脉冲响应,∗为卷积运算。
  3. Receiver(接收机)
    由于发射机和接收机的信道损坏和硬件缺陷,接收器输出的无线信号将是发射信号的损坏版本。典型的硬件相关损失有:
    (1) 由电阻元件(如接收天线)引起的噪声。这种热噪声可以被建模为加性高斯白噪声(AWGN),n ~ n (0,σ2)。
    (2) 由发射机fc和接收机fc的本振(LO:local pscillator)信号频率略有不同引起的频率偏移
    (3) 相位噪声,其中φ (t),由用于解调所接收的无线信号的LOs内的频率漂移引起。它使LO信号的角度漂移在其预定的瞬时相位2πfct附近。
    (4)由接收机和发射机的采样率差异引起的定时漂移

接收到的无线信号模型可以由End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中rb(t)为基带复包络由:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中hb(t,τ)是具有l个不同传播路径的基带信道等效,每个路径都具有时变路径衰减αi(t, τi)和路径延迟τi,由
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
B. DATA ACQUISITION(数据采集)
为了获得用于无线信号识别的机器学习模型,需要收集足够的训练数据。
图3总结了无线信号特征采集的数据采集过程。接收到的信号r(t)首先被放大、混合、低通滤波,然后发送到模拟到数字(A/D)转换器,该转换器以每秒1/ ts采样率对连续时间信号进行采样,并生成离散版本rn。
离散信号rn= r[nTS]由两个分量组成,同相分量rI和正交分量rQ。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

假设,我们对周期T进行采样,收集一批N个样本。信号样本r[n]∈C, n = 0,…,N−1,是一个复杂原始样本的时间序列,可以用数据向量表示。第k个数据向量记为:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
与在音频信号处理中看到的类似,这些数据向量RK是接收到的连续样本流的加窗或分段表示。它们携带用于评估所感测到哪种类型的无线信号的信息。这可以是调制类型、无线技术类型、干扰源等。

C. WIRELESS SIGNAL REPRESENTATION(无线信号表示)
ML接收机基带处理链在采集到第k个数据向量后,将其转换为适合训练的新表示。也就是说,第k个数据向量rk∈CN被转换成第k个特征向量Xk∈RN
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
本文考虑三种简单的数据表示。第一个是原始复数时域无线信号的实值等效第二种是基于无线信号的振幅和相位,类似于Selim等人用于识别雷达信号的工作。最后是受Danev和Capkun工作启发的频域表示,在无线设备识别方面,基于频率的特征优于基于时间的等价特征。每个数据表示快照具有N个数据点的固定长度。
对于每个转换,数据被可视化以形成关于哪种数据表示可以为机器学习提供最具区分性的特征的某种直觉。使用以下数据/信号转换:

  1. 变换1(IQ向量):IQ向量是原始复数样本(即数据向量Rk∈Cn)到两组实值数据向量的映射,一组携带同相样本Xi,另一组保存正交分量值Xq。那是:
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    从数学上讲,这可以写成
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
  2. (A/φ向量):A/φ向量是原始复数据向量rk∈cN到两个实值向量的映射,一个表示其相位φ,另一个表示其大小A,即。
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    相xφ∈RN,幅值向量xA∈RN具有这些元素
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
  3. FFT向量是一个从原始时域复杂的数据映射向量rk∈CN到它的频域表示向量组成的两套实值向量数据,一个带有真正的组件的复杂FFT xFre和一个FFT xFim的虚构的成分。这是
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    转换到频域是通过快速傅里叶变换(FFT)表示为F,因此
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
    这里w∈CN, xFre,xFim∈RNwhile <{。} ={。}可以被看作是分别给出复向量实部和虚部的算子。因此,得到的FFT向量是xkF∈R2×N。简而言之,这可以表示为
    End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

图4、图5和图6分别可视化了IQA/φfft特征向量的例子。

可视化显示了不同调制格式通过具有损伤的通道模型的表示,如IV -A所述。这些是第V -A节中介绍的“RadioML调制”数据集所描述的128个调制格式示例。图4显示了接收端不同调制类型的原始采样复信号的xIQ ktime图。图5显示了调制格式示例的振幅和相位时间图。图6显示了它们的频率幅值谱。

可以看出,由于无线信道效应和收发同步不完善,信号被破坏了,但仍有独特的模式可以用于深度学习提取高级特征用于无线信号识别。

使用这三个转换背后的动机是为了训练三个深度学习模型:一个将探索原始数据,仅仅从原始样本发现模式和时间特征,一个将看到振幅和相位信息在时域,而第三将看到频域表示,在频率空间进行特征提取。我们研究如何选择数据表示影响分类精度。这些数据表示都经过了精心设计,因此它们都创建了具有相同维度的向量,并在R2×N中输入。这样做的原因是获得一个统一的矢量形状,这将允许使用相同的CNN架构来训练所有三种数据表示和不同的用例。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
D. WIRELESS SIGNAL CLASSIFICATION(无线信号分类)
从频谱数据中识别无线信号的问题可以看作是一个数据驱动的机器学习分类问题。为了将ML技术应用于此设置,如第III-A节所述,无线通信问题必须表述为参数估计问题,其中某些参数是未知的,需要进行估计。

给定一组待检测的K个无线信号,从该集合中识别一个信号的问题就变成了一个K类分类问题。假设数据测量点知道传输的信号类型(例如调制类型、干扰发射器类型等),时间周期t=0,T,并将每个信号类型的n个测量值的几个复基带时间序列收集到数据向量Rk中,如第IV-B节中所述。总共收集了数据向量RK的mSnapshot。这些数据矢量包含包含独特特征的发射信号。为了提取这些特征,根据第IV-C节中介绍的数据变换,将每个数据向量变换为特征向量Xk,并将结果堆叠到观测矩阵X∈Rm×n中。
对每个数据向量进一步用相应的无线信号类型进行标注,其形式为离散的单热编码向量yk∈RK, k = 1,…, m。
得到的数据对{(xk,yk),k=1,.。。。M}形成适合于估计表征无线信号分类器f的参数θ的数据集
值得注意的是,训练阶段假定发射机上使用的无线信号类型的先验信息。然而,一旦分类器被训练,该信息将不再是必要的,并且信号可以由模型自动识别。也就是说,对于第i个频谱数据矢量输入xi,预测器的最后一层可以自动输出概率P(yi=k|xi;θ)的估计,其中k的范围从0到K−1。这是记分级。最后,预测的类别就是得分最高的类别,即ˆyi=argmax k P(yi=k|xi;θ)。

V. EVALUATION SETUP

为了评估来自频谱数据的端到端学习,我们针对两个使用案例训练CNN无线信号分类器:(I)无线信号调制识别和(Ii)无线干扰识别,用于不同的无线数据表示。

无线电信号调制识别涉及在频谱监测任务中识别接收到的无线信号的调制结构的问题,作为了解存在什么类型的通信方案和发射器的一步。调制识别对于无线电频谱调节和动态频谱接入应用是至关重要的。

无线干扰识别是识别工作在同一频段的共存无线发射体类型的任务。这对于在诸如由异构无线通信系统共享的2.4 GHz工业、科学和医疗(ISM)频段的无许可频段中有效的干扰缓解和共存管理是必不可少的

每个人物训练了三种特征数据表示:IQ向量、振幅/相位向量和FFT向量,如第四节-C所介绍。因此,对于每个任务,创建三个数据集S,每个数据转换创建一个。也就是说,
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
其中m有数万个实例。

A. DATASETS DESCRIPTION(数据集描述)

  1. 无线电调制识别
    为了评估用于无线电调制类型识别的端到端学习,我们考虑对来自“RadioML 2016.10a调制”数据集的各种调制格式的接收无线信号的测量[9]。具体地说,对于本文执行的所有实验,我们使用了用于以下数字调制格式的标记数据向量:BPSK、QPSK、8-PSK、16-QAM、64-QAM、CPFSK、GFSK、4-PAM、WBFM、AM-DSB、AM-SSB。在N=128个采样批次中以1ms/s的采样速率收集数据矢量Xk,每个采样批次包含8到16个码元,这些码元被IV-A中的信道模型所描述的随机噪声、时间偏移、相位和无线信道失真所破坏。一热编码用于创建对应于11个考虑调制的11个类别标签的离散集合,从而响应变量形成二进制11向量YK∈R11。因此,调制识别的任务是一个11类分类问题。总共使用了220,000个由I和Q样本组成的数据矢量XK∈R2×128
  2. ism波段无线干扰识别
    在未经许可的ISM频段内运行的异构无线技术的兴起,由于交叉技术干扰,造成了严重的通信挑战,这对无线网络的性能产生了不利影响。为了应对这些挑战,需要新的敏捷方法来评估通道条件。我们展示了端到端学习作为一种有前途的方法,它可以通过准确识别跨技术干扰来确定在无线链路上的通信是否可行。具体来说,我们使用了“无线干扰”数据集[12],该数据集由基于IEEE 802.11b/g (WiFi)、IEEE 802.15.4 (Zigbee)和IEEE 802.15.1 (Bluetooth)标准的、运行在2.4GHz频段的标准化无线通信系统采集的测量数据组成。根据所分配的信道和相应的无线技术对数据集进行标记,得到15个不同的类。与调制识别数据集相比,该数据集由假设信道损伤较小的通信信道模型收集的测量数据组成。特别地,我们假设一个平坦的衰落信道与加性高斯白噪声。I和Q样本以10MS/s的采样速率,每批128个,根据符号持续时间,每一种使用的无线技术捕获1 ~ 12个符号。总共收集了225225张快照。

B. CNN NETWORK STRUCTURE(CNN网络结构)
用于频谱数据端到端学习的卷积神经网络结构来源于O’shea等人的[9],即CNN2网络,因为它已经显示出明显优于传统的信号识别方法
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
表1提供了所使用的CNN网络的摘要。网络的可见层具有2×128的统一大小,接收包含复杂无线信号的样本值的IQ、FFT或幅度/相位捕获数据矢量XK∈R2×128。两个隐藏卷积层还使用核和RELU激活函数从输入无线信号表示中提取高级特征。第一卷积层由256个大小为1×3的堆叠滤波器组成,其对填充的输入复信号表示执行2D卷积,使得输出具有与原始输入相同的长度。这些滤波器生成256(2×128)个特征图,作为输入馈送到第二层,第二层有80个大小为2×3的滤波器。为了减少过拟合,在每一层中使用正则化,丢失率p=0.6。最后,添加了一个由256个神经元和REU单元组成的完全连接层。这一层的输出被馈送到SoftMax分类器,该分类器估计输入信号x属于特定类别y.isp(y=k|x;θ)的可能性,其中k是一热编码向量,使得k∈R15用于无线干扰识别情况,k∈R11 用于调制识别。
C. IMPLEMENTATION DETAILS(实施细节)

CNN是在Amazon Elastic Compute(EC)Cloud的高计算平台上使用Kera[29]库进行训练和验证的,该平台采用*处理器(CPU)Intel®Xeon®CPU E5-2686 v4@2.30 GHz、60 GB RAM和支持CUDA的图形处理器(GPU)NVIDIA Tesla K80。对于这两种用例,67%的随机选择的示例用于1024批大小的训练,33%用于测试和验证。因此,对于调制识别,147,400个示例用于训练,而72,600个示例用于测试和验证。对于干扰识别任务,151200个样本为训练样本,74025个样本用于测试模型。这两组示例均均匀分布在−20dB至+20dB的信噪比(SNR)中,并进行了标记,以便可以在特定子集上评估性能。

为了确保训练有素的CNN能在时变的无线信道条件下准确地检测到信号,作为CNN学习过程的输入的无线训练数据需要足够大和灵活,通过结合发射信号上变化的信道畸变。一旦提取了CNN模型的滤波系数,该模型就可以实时检测出被感知的无线信号的类型。检测效率取决于CNN网络结构usedatpredictiontime的复杂度。计算所有神经元的卷积和激活需要时间。我们选择自适应矩估计(Adam)优化器[30]估计模型参数,学习率α = 0.001以确保收敛。为了加快模型的学习和收敛过程,对输入数据进行了归一化处理,并选择了ReLU激活单元。

在70个历元上对CNN进行训练,选择有效性损失最小的模型进行评估。总共训练了6个CNN,即每个用例和信号表示一个CNN。三个用于调制识别:CNNM IQ、CNNMA/φ和CNNM F,以及三个用于技术识别CNNIF IQ、CNNIF A/φ和CNNIF F。在GPU上的训练时间导致执行干扰识别的CNN的持续时间约为每个历元60s,而调制识别CNN的持续时间为42s。

D. PERFORMANCE METRICS(性能指标)

为了表征和比较识别调制类型或识别干扰的端到端无线信号分类模型的预测精度,我们需要测量它们的预测与观测频谱数据的真实响应值是否匹配。因此,端到端信号分类方法的性能可以通过测试数据样本的预测精度来量化。

如果任一实例的信号分类器的真值和估计值分别由YI和ˆYI给出,则总体分类测试覆盖测试快照可以按以下方式定义:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
然后用1−Etest获得分类精度。
对测试集中的每个信号快照,计算中间统计量,即真阳性(TP)、假阳性(FP)、假阴性(FN)的个数如下:

  1. 对测试集中的每个信号快照,计算中间统计量,即真阳性(TP)、假阳性(FP)、假阴性(FN)的个数如下:
  2. 如果一个信号被预测为来自某个特定的类,但根据标记的测试数据不属于该类,则该实例被视为FP
  3. 如果在特定实例中没有检测到信号,但在标记测试数据中该实例中存在,则该实例视为FN。

中间统计信息在测试集中的所有实例上累加,并用于导出另外三个性能度量精度§、召回®和F1得分:
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
精确度、召回率和F1score是每个级别的性能指标。为了获得量化分类器的总体性能的度量,多个单个类的性能度量使用跨类度量Pavg、Ravg和F1avg的流行度加权宏观平均进行组合。对于每个类的性能的详细概述,使用了混淆矩阵。

E. NUMERICAL RESUL TS(数值结果)
1. 分类性能(classification performance)
表1中描述的CNN网络针对两个无线信号识别问题在三个数据表示上进行训练。表2提供了六个分类器的平均性能。即在高信噪比(信噪比=18dB)、中信噪比(信噪比=0dB)和低信噪比(信噪比=−8dB)三种信噪比场景下的准确率、召回率和F1得分的流行加权宏观平均值。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

我们观察到,与调制识别情况相比,干扰分类模型表现出更好的性能。在高信噪比条件下,CNNIF模型的Pavg、Ravg和F1avg介于0.98和0.99之间。对于中信噪比,度量在0.94到0.99的范围内,而在低信噪比条件下,性能略有下降到0.81-0.90。CNNM模型对不同的信噪比条件表现出较差的鲁棒性,通常在所有场景下分类性能都较差。特别地,在高信噪比条件下,根据所使用的数据表示,所实现的Pavg、Ravg和F1avgare在0.67-0.86的范围内。对于中等SNR,性能降幅比CNNIF模型更大,Pavg、Ravg和F1avg在0.59-0.75的范围内。在低信噪比下,CNNM模型的性能较差,度量值在0.22-0.36之间。

我们观察到,与调制识别情况相比,干扰分类模型表现出更好的性能。在高信噪比条件下,CNNIF模型的Pavg、Ravg和F1avg介于0.98和0.99之间。对于中信噪比,度量在0.94到0.99的范围内,而在低信噪比条件下,性能略有下降到0.81-0.90。CNNM模型对不同的信噪比条件表现出较差的鲁棒性,通常在所有场景下分类性能都较差。特别地,在高信噪比条件下,根据所使用的数据表示,所实现的Pavg、Ravg和F1avgare在0.67-0.86的范围内。对于中等SNR,性能降幅比CNNIF模型更大,Pavg、Ravg和F1avg在0.59-0.75的范围内。在低信噪比下,CNNM模型的性能较差,度量值在0.22-0.36之间。

这可以通过为两个案例研究生成数据集使用的不同通道模型以及在每个问题中需要区分的信号类型来解释。例如,对于中频情况,考虑了一个简单的平衰落信道模型,而对于调制识别,信道模型也考虑了时间变化的多径衰落信道和其他收发器损伤。因此,调制识别数据集在数据采集过程中使用了更真实的信道模型。然而,这影响了分类性能,因为与中频分类问题中考虑的信道条件相比,在这种情况下设计一个鲁棒信号分类器更具挑战性。此外,中频检测的分类信号具有不同的设计特征。特别是,它们使用不同的媒体访问方案、信道带宽和调制技术,这使得分类器更容易区分它们。相反,所选择的调制识别信号彼此更相似,因为调制的子集基于相似的设计原则(例如,所有都是单载波调制)。

为了更好地理解CNNMIQ混淆矩阵的结果,在信噪比为6dB时,CNNMA/φ和CNNM f模型如图7所示。可以看出,该分类器对AM-DSB、AM-SSB、BPSK、CPFSK、GFSK和PAM4三种数据表示均表现出良好的识别性能,且均具有较高的精度。主要的差异是QAM16被误分类为QAM64,这可以通过基础数据集来解释。QAM16是QAM64的一个子集,这使得分类器很难对它们进行区分。与CNNM IQ相比,振幅/相位信息有助于模型更好地区分QAM16/QAM64,从而使CNNM a /φ的对角线更加清晰。在AM-DSB和WBFM信号的分离上还有进一步的困难。这种混淆可能是由于信号的缺失引起的,因为调制信号是从真实的音频流中产生的。在使用频谱数据的情况下,可以发现CNNM f分类器最容易混淆QPSK、8PSK、QAM16和QAM16,这是由于信道失真后它们在频域上的相似性,使得接收到的符号彼此无法区分。
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)
End-to-End Learning From Spectrum Data: A DL Approach for Wireless Signal Identification(阅读笔记)

2. 噪声敏感性(noise sensitivity)
在本节中,我们评估了CNN信号分类器在不同噪声水平下的检测性能。这就允许我们调查分类器可以被有效使用的通信范围。为了估计对噪声的敏感性,同样的测试集被标记为- 20dB到+20dB的信噪比值,并输入信号分类器获得每个信噪比的估计值。图8和图9分别给出了调制识别模型和中频识别模型得到的结果。

调制识别案例
图8显示,在很低的信噪比(<−10dB)下,三种调制识别细胞神经网络模型具有相似的性能,在中等信噪比下,CNNM I/Q模型的性能比CNNMA/φ和CNNM F模型高2-5dB,而在高信噪比条件下(>5dB),CNNM A/φ模型的精度分别比CNNM I/Q模型和CNNM F模型高2%和12%。

O‘Shea等人。[9]使用了智商数据,并报告了比我们获得的结果更高的准确性。在对智商数据进行了各种尝试后,我们无法再现他们的结果,这可能是由于数据集(例如,训练样本的数量)、训练/测试分离和超参数调整的差异。然而,我们注意到,在高信噪比的情况下,与原始IQ时间序列数据相比,幅度/相位表示有助于模型更好地区分调制格式。我们感到遗憾的是,在[9]中也没有报告幅度/相位表示的结果,因为这可能有助于提高性能。与智商数据相比,使用频谱数据并没有提高分类精度。这是预期的,因为底层数据集具有许多调制类别,在信道失真和接收器缺陷效应(特别是QPSK、8PSK、QAM16和QAM64)之后,这些调制类别在频域中表现出共同的特征。这使得频谱成为该分类问题的次优表示。

干扰检测情况
图9中的中频识别模型总体上比调制识别分类器表现出更好的性能,其中CNNIF f在所有信噪比场景中表现出最佳性能。特别是在低信噪比情况下,与CNNIF A/φ和CNNIF I/ q模型相比,CNNIF A/φ和CNNIF I/ q模型的性能增益至少提高了约4dB,分类精度至少提高了约9%。Schmidt等人[12]使用IQ和FFT数据表示,报告了与我们的CNNIF I/Qand CNNIF f模型相似的结果。然而,我们再次注意到,与原始IQ数据相比,振幅/相位表示有利于鉴别信号。而中频识别分类器在FFT数据表示上表现最好。这可能是由ismbandstandards (ZigBee,WiFiandBluetooth)的无线信号在频域有更多的表达特征,因为它们在带宽和调制/传播方法方面有不同的频谱特性。

这可能是因为无线信号频谱标准(紫蜂、无线和蓝牙)在频域中有更多的表现特征,因为它们在带宽和调制/扩展方法方面有不同的频谱特征。

研究CNN在无线电信号识别中的应用的其他现有研究尝试的例子有[10]和[11]。Selim等人。[10]训练一个具有5层卷积和2层全连通的CNN,根据幅值和相移数据识别雷达信号。与我们工作中提出的方法相比,Selim等人。[10]解决了二分类问题,并以雷达脉冲检测概率作为度量对该模型进行了评估。Akeret等人。[11]训练基于U-Net[31]架构的CNN,以检测射电天文学应用中的RF干扰。它们使用不同的性能指标,例如曲线下面积(AUC)和接收器工作曲线(ROC),但没有进行噪声敏感性性能分析(模型精度与信噪比)。

外卖食品(takeaway 的复数)
端到端学习是数据驱动频谱监控应用的强大工具。它可以应用于各种无线信号,以统一的方式有效地检测无线电发射器的存在,而不需要设计专家特征。实验表明,无线信号分类器的性能取决于所使用的数据表示。这表明,研究几种数据表示对于针对特定任务获得准确的无线信号分类器非常重要。此外,数据表示的选择取决于问题的具体情况,即考虑用于分类的无线信号类型。数据集中在一个数据表示中表现出相似特征的信号更难区分,这给模型学习过程带来了更高的负担。选择正确的无线数据表示可以显著提高分类性能,而频谱监控应用中针对的基础信号细节的领域知识有助于提高分类性能。另外,分类器的性能可以通过提高无线信号数据集的质量、通过添加更多的训练示例、示例之间更多的变化(例如,变化的信道条件)以及调整模型超参数来提高。

VI. OPEN CHALLENGES

尽管研究结果令人鼓舞,但基于深度学习的端到端频谱利用优化学习框架仍处于起步阶段。在下文中,我们将讨论这个激动人心的跨学科领域带来的一些最重要的挑战。

A.可扩展频谱监控
认知频谱监测框架的第一个要求是拥有支持可扩展频谱数据收集、传输和存储的基础设施。为了获得频谱使用的详细概述,要求终端设备在较宽的频率范围内执行分布式频谱检测[32],并覆盖感兴趣的区域。为了限制由监控设备生成的大量I和Q样本导致的数据开销,可以将预测模型推送到终端设备本身。最近,[33]提出了电感知,这是一项在世界不同地区使用低成本传感器进行大规模光谱监测的倡议,并将处理后的光谱数据作为文本笔光谱数据提供。访问大型数据集对于评估研究进展和为无线通信研究人员提供一个游乐场至关重要,这些研究人员有兴趣获得更深入的频谱使用知识,并提取有意义的知识,用于设计更好的无线通信系统。

A.可扩展频谱学习
工作在不同无线电波段的技术的异质性要求连续监测多个频带,使得无线电频谱数据的体积和速度比在诸如无线传感器网络(例如温度、湿度报告等)的其他无线通信系统中看到的典型数据高几个数量级。).为了处理如此大量的数据,并在整个频谱范围内提取有意义的信息,必须设计并实现一个可扩展的平台,用于处理、分析和学习大频谱数据[3],[34]。需要高效的数据处理和存储系统以及算法来进行特别的数据分析[35],以便从这些数据中提取有价值的信息,并将其实时纳入频谱决策/政策过程

A.灵活的频谱管理
5G的主要通信挑战之一将是蜂窝间和跨技术干扰。为了在如此复杂的系统中支持频谱决策和政策,5G网络需要支持灵活的频谱管理架构。无线电级的软件化将是灵活的频谱管理的关键因素,因为它可以实现频谱数据的自动化收集、灵活控制和认知无线电要素和参数的重新配置。有几部作品都关注这个问题。嵌入式设备的一些方案是WiSCoP [36] Atomix[37]和[38]。近年来,将软件定义网络(Software Defined Networking, SDN)和网络功能虚拟化(Network Function Virtualization, NFV)应用于无线网络[39]也引起了学术界和业界的广泛关注。诸如SoftAir[40]、Cloud RAN[41]、OpenRadio[42]等项目仍处于概念或原型水平。为了使灵活的光谱管理策略实现和商业化,还需要进行大量的标准化工作。
A.频谱隐私
智能无线系统的引入引发了几个隐私问题。该频谱将通过不同的无线电进行监控,包括无线传感器网络(WSNs)、射频识别(RFID)、移动电话和其他,这可能导致应用程序的误用,并造成严重的隐私相关威胁。因此,在频谱数据收集级别需要隐私。由于频谱数据可能在此过程中被共享,隐私也必须在数据共享级别上得到维护。因此,需要对数据进行匿名化、有限制的数据访问、正确的身份验证和对智能无线电用户的严格控制。

7结论

本文全面系统地介绍了频谱数据端到端学习——一种基于深度学习的统一实现无线信号识别任务的方法,这是频谱监控系统的主要组成部分。该方法围绕深度学习技术的系统应用展开,在端到端学习管道中获取精确的无线信号分类器。特别是,卷积神经网络(CNNs)很适合这种设置,因为它们由许多层处理单元组成,能够(i)自动提取非线性和更抽象的无线信号特征,这些特征对局部频谱和时间变化不变性,(ii)训练优于传统方法的无线信号分类器。

为了提高人们对这一新兴跨学科研究领域潜力的认识,首先简要介绍了机器学习、深度学习和cnn,并提出了一种用于光谱监测场景的参考模型。在此基础上,提出了基于频谱数据的端到端学习框架。详细阐述了无线数据采集、无线信号特征的设计和适用于多种无线信号识别任务的分类器。定义了三种常用的无线信号表示,即原始IQ时域无线信号、时域幅值和相位信息数据以及频谱幅值表示。提出的方法在两个主动无线信号识别研究问题上得到了验证:(i)调制识别对动态频谱接入应用至关重要,(ii)无线干扰识别对无许可频带中有效的干扰抑制策略至关重要。实验表明,神经网络是一种很有前途的特征学习和函数逼近技术,非常适合于不同的无线信号分类问题。此外,本文的研究结果表明,对于无线通信领域,研究不同的无线数据表示对于确定对需要分类的信号具有鉴别特征的帧表示非常重要。

具体来说,在调制识别案例研究中,在振幅/相位表示上训练的中高信噪比CNN模型训练比其他两种模型的性能提高了2%和10%,而在低信噪比条件下,在IQ数据表示上训练的模型表现最佳。对于检测干扰的任务,在低信噪比条件下,在FFT数据上训练的模型比振幅/相位和IQ数据表示模型的性能提高了20%,而在中高信噪比高达5%的情况下,分类精度提高。

这些结果表明了选择正确的数据表示和机器学习方法的重要性,这两者在本文中都被系统地介绍。通过遵循所提出的方法,可以获得关于不同研究领域的数据表示的最优性的更深层次的见解。因此,我们设想本论文能够授权和指导机器学习/信号处理从业者和无线工程师设计新的创新研究应用,从频谱数据到终末学习,解决与跨技术共存、低效频谱利用和调节相关的问题。

上一篇:优化案例(part4)--A novel consensus learning approach to incomplete multi-view clustering


下一篇: