摘要
WiFi是物联网的粘合剂,大多数无线设备使用WiFi接入物联网。监控和识别接入WiFi设备对于物联网的安全尤其重要,尤其是敏感区域。在这种背景下,我们提出了一种基于WiFi设备功率谱密度(PSD)和前导信号置换熵(PE)的WiFi设备分类框架。四个无线网卡正在测试以验证我们的方法。采用K-NN分类法。实验结果表明,在信噪比为-5db的情况下,两种方法的识别率均在90%以上。
物联网、特定辐射源识别、功率谱密度、排列熵等指标
一. 导言
在过去的几年里,随着无线设备的发展和普及,我们的生活发生了很大的变化。这些设备也在推动物联网的发展。WiFi作为物联网的粘合剂,在物联网时代发挥着不可替代的作用。大多数设备使用WiFi技术访问物联网[1]。根据ABI研究报告,2015年至2019年WiFi芯片的出货量接近180亿美元[2]。由于WiFi的开放性和普遍性。任何人都可以使用WiFi设备访问物联网。物联网的安全性受到质疑[3]。随着物联网的快速发展,信息安全风险将不断扩大,其影响将远远超出互联网。在未来几年,一种能够监控和识别WiFi设备,并使其远离敏感区域的技术将成为基础。因此,有必要对物联网中的WiFi设备进行识别和监控,阻断威胁设备对物联网的访问。例如,考虑到图1所示的智能家居场景,监视器的作用是监视和识别室内WiFi设备,并禁止非法设备访问物联网。
特定辐射源识别(SEI)是一种常见的无线设备识别方案。它只使用外部特征来测量称为射频指纹的无线信号[4][5]。WiFi设备通常在2.4G UHF或5G SHF ISM RF频段运行。IEEE 802.11协议标准定义了WiFi设备的物理层[6]。通常,WiFi设备会周期性地输入振幅并重复前导码,每个信息流的前端会附加一个前导信号[7]。所以我们可以用SEI技术提取对WiFi前导信号进行RF指纹识别,进而识别网络中的WiFi个体,增强物联网的安全性。
本文采用功率谱密度(PSD)和每变异熵(PE)算法对WiFi设备进行识别。我们还比较了两种算法的差异。我们建议提取WiFi信号的PSD和PE作为RF指纹来识别连接到物联网的WiFi设备。这些特性是由接入设备的硬件差异决定的,不能伪造。它可以有效防止未经授权的设备访问物联网。
本文的主要贡献如下:
基于WiFi信号的前导信号部分,提出利用SEI技术来识别接入物联网的WiFi设备。
采集四块无线网卡产生的WiFi信号,提取前导信号的PSD和PE作为射频指纹。
实验结果表明,在四种信噪比条件下,PSD和PE的识别率均能达到90%以上。
实验结果还表明,PSD具有较好的信噪比容限,当信噪比大于-10dB时,PSD的识别率可达90%以上。
论文的剩余部分组织如下:II概述了无线设备识别技术的现有文献。第三节简要介绍PSD和PE的工作原理。第四节,提出了一种信号采集模型,提取了信号的PSD和PE。第五节给出了识别效果,并比较了两种算法的区别。最后,结束语载于第六节。
二. 相关工作
不同类型的无线设备通常遵循不同的协议标准。图2显示了一个典型的WiFi通信信号,它可以分为三个主要部分:信道噪声部分、瞬态信号部分和稳态信号部分。信道噪声段主要由信道噪声和设备噪声组成,它是接收设备中不包含有效信号的部分。瞬变信号段是指由发射机发出的从额定功率到零的信号。它通常不包含任何数据信息,仅由设备的硬件特性决定。稳态信号部分是发射机和接收机之间正常通信的信号部分。对稳态信号进行分段处理,提取其信号特征,达到识别无线设备的目的。2008年,Kennedy等人首次提出将无线通信信号的前导信号转换为频谱作为射频指纹,并将射频指纹用于UMTS用户设备的识别[8]。在[9]中,Suski等人通过获取无线设备前导信号瞬时幅度和瞬时相位的方差轨迹,得到信号检测的起点,并将前导信号的功率谱密度作为射频指纹,利用频谱相关法对无线设备进行分类。在高信噪比下,识别率达到80%,但在低信噪比下的性能一般。
2011年,Shi等人提取了信号数据段中的误差矢量幅值、载波中心频率偏差、OFDM导频相位偏差、符号总偏差、I/Q偏移和前导码相关作为RF指纹。同时,首次运用信息论方法研究了“射频指纹特征”的有效性[10]。
2015年,Knox等人将解调后的无线通信信号的相位信息提取为射频指纹,并测试了其在不同温度和信道条件下的分类性能。经测试,平均识别率为81.9%。在固定通道中,12小时内的变化总是小于8%[11]。文[12]提出了发射机的非线性建模方法。采用相空间重构方法,选取重构相空间的两类特征作为射频指纹。他们使用主成分分析(PCA)和支持向量机(SVM)来识别四个无线网卡。在实际测量中,当信噪比大于10db时,平均识别率达到94%。
3. 方法综述
简要介绍了功率谱密度(PSD)和置换熵(PE)两种算法。
A.功率谱密度
PSD算法是一种在频域分析随机信号的方法。它的目的是从有噪声干扰的有限观测数据中提取信号或信号参数,即单位频率的信号功率。周期图法、自相关法和改进法是基于相关和傅立叶变换的经典功率谱估计算法。本文采用改进的周期图法韦尔奇平均周期法估计信号的功率谱密度。
Welch方法是周期图方法的改进,它解决了周期图方法得到的功率谱估计不一致的问题,减少了方差。我们假设xi(n)(i=0,1,···,L− 1) 是随机过程x(n)的L个无关实现,M是每个xi(n)的长度,可以得到xi(n)的周期图:
信号的功率谱密度可通过平均获得的独立周期图获得:
经典地,随机信号的多个实现通常很难获得。我们可以把一个长度为N的随机信号分成K段,每个段的长度为M。我们为获得的每个子信号获得周期图,并平均所有周期图以获得功率谱密度估计:
B. 排列熵
PE是Christoph-Bandt和Bernd-ponpe提出的一种动态变异检测算法。它能方便准确地定位系统突变时刻,并将信号中的微小变化放大。此外,它还具有计算简单、灵敏度高、抗噪声性能强等优点[13][14]。
假设x(t){t=1,2,…,t}是长度为t的时间序列,我们指定了一个嵌入维数m。将事件序列映射到m维空间Xt={x(t),x(t+1),…,x(t+m)−1) }(t=1,2,…,t)−m+1)。如果我们对Xt进行递增排序,得到x(t+j1)−1) ≤ x(t+j2)−1) ≤ … ≤ x(t+jm)− 1). 其中,当两个值相等时,按ji的下标排序。然后Xt被映射到Ym={j1,j2,…,jm}。这是一个m!安排。换句话说,每个m维子序列Xt被映射到其中一个m!安排。我们可以使用符号序列Ym={j1,j2,…,jm}来表示连续的m维子空间。我们取概率分布Pj(j=1,2,…,K)或所有映射符号序列,其中K≤ M然后,我们计算Pj的香农熵,得到时间序列Xt的排列熵:
当Pj=1/m!,这意味着每个符号都存在,并且其概率是相等的。此时,时间序列的复杂度最高,得到的置换熵最高,即ln(m!)。一般来说,为了方便起见,我们将PE标准化:
其中0≤ 高度(m)≤. 归一化渗透熵(NPE)的值表示时间序列的随机性,值越大,时间序列的随机性越大。可以看出,PE放大了信号中的微小变化[15]。
4. 识别框架
在本节中,我们将介绍一个信号采集系统。首先采集同一型号、同一批次的四块WLAN卡的信号。分别采用PSD和PE算法进行特征提取。最后,利用三维图形和箱线图验证了这些特征的有效性。
A.信号采集
为了获取WLAN卡的信号,我们搭建了如图3所示的信号采集系统。该系统包括一台电脑、无线网卡、一部手机和一台示波器。采用带WALN卡的计算机作为发射机,手机作为接收机接入辐射无线网络。然后,在发射器和接收器之间执行实时无线通信。同时利用数字示波器以20Gsps的采样率采集实时通信信号。采集的信号通过电缆传输到计算机进行存储。然后利用MATLAB等软件对数据进行预处理。
B. 特征提取
首先,我们将四个WLAN卡标记为W01−W04,每个类别的WLAN卡包含120个样本。在预处理过程中,我们在每个样本中截取一段前导信号。处理后的每个采样信号包含30万个采样点。由于在获取信号时天线被放置在离WLAN卡0.5m的位置,因此接收到的信号具有约30db的SNR。我们认为接收到的信号噪声可以忽略不计。在对信号进行预处理时,加入不同功率的AWGN,得到不同信噪比的信号。然后,分别提取信号的PSD和PE。
a) PSD:为了减少数据集的大小,并保留区分WiFi个人所需的信息。采用PCA算法对数据进行降维。然后建立三维地图,观察特征的有效性。从图4中我们可以看出,在0分贝、5分贝和10分贝时,每个个体都与其他个体有很好的区别。即使是-5dB,个体之间也有很好的区别。
b) PE:为了显示不同个体之间PE特征的差异,我们使用箱线图来可视化特征。箱线图使用五种统计数据:最小观察值、下四分位数、中位数、上四分位数和最大观察值来描述数据。它可以直观地帮助我们了解数据是否具有对称性、离散度分配的一部分。特别是比较几个样品。在计算每个采样信号的PE时,我们选择嵌入维数m=3,然后对得到的PE进行归一化,得到NPEV。
从图5可以看出,在四种不同的信噪比下,可以很好地区分WLAN卡个体。
5. 实验结果
A.分类结果
在特征提取之后,选择K-NN分类器进行分类。在分类过程中,设定k=7,在每个个体中,我们选取84个样本作为训练集,36个样本作为测试集。
a) PSD:
图6显示了不同信噪比下的分类精度。从图中可以看出,PSD算法在四种信噪比条件下都表现良好。0dB、5dB和10dB的识别率均能达到94%以上。即使信噪比为-5db,分类精度也达到91%左右。
b) PE:
图7显示了PE算法的分类结果。从图中可以看出,识别率保持在90%以上,而信噪比从-5 dB变为10 dB。
结果表明,PSD和PE算法能很好地识别WLAN卡,即使在低信噪比下,识别率也能达到90%以上。两种算法之间没有显著差异。因此,我们需要更多的实验来探索这两种算法的性能差异。
B. 算法比较
为了比较两种算法的区别,我们测试了两种算法在不同信噪比下的识别性能。同样,我们设定k=7,进行100次蒙特卡罗实验。然后得到平均识别率。图8显示了两种算法在不同信噪比下的识别率。
从图8可以看出,PSD和PE算法都是不同信噪比下WLAN卡分类的良好候选特征。不同的是PSD算法在低信噪比下性能更好,PE算法收敛速度更快。我们认为PSD和PE达到了最好的分类精度。但是,从实现和复杂性的角度来看,PSD比PE更具吸引力。由于WiFi设备在实际工作中环境噪声波动较大,检测算法需要对信噪比有较大的容忍度。
6. 结论
本文利用SEI识别接入物联网的WiFi设备。从前导信号中提取PSD和PE作为射频指纹。并通过信号采集系统,采集了四个无线网卡的通信信号。采用K-NN分类器进行分类。实验结果表明,当信噪比大于0dB时,两种算法的识别率均能达到90%以上,PSD算法在低信噪比下表现良好,PE算法收敛速度较快。对于未来的工作,我们将确定更多类型的无线设备,而不仅仅限于使用WiFi的无线设备。
7. 致谢
这项工作得到中国国家自然科学基金(61771154)和*大学基础研究基金(HEUCF20120130)的资助。
本文是由哈尔滨工程大学国际交流计划资助的创新型人才培养。
同时,所有作者声明,关于这篇文章的发表不存在利益冲突。我们非常感谢审稿人进行了非常有益的讨论。