这里写自定义目录标题
30天挑战翻译100篇论文
坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长…
A Faster Maximum-Likelihood Modulation Classification in Flat Fading Non-Gaussian Channels
一种在平坦衰落非高斯信道中更快的最大似然估计的调制分类方法
Wenhao Chen , Zhuochen Xie, Lu Ma, Jie Liu, and Xuwen Liang
摘要—在本文中,我们使用平方迭代方法和参数检查来加快在平坦衰落非高斯信道中盲目估计信道参数时期望/条件最大化(ECM)算法的收敛速度,此外,我们提出了在平坦衰落的非高斯信道上,基于最大似然估计器的自动调制分类(AMC) 方法。 数值结果表明,该方法可以加快ECM算法的收敛速度,并且基于AMC的算法比基于ECM的算法具有更快的收敛速度,而前者的精度与后者相比几乎没有损失。
关键字-最大似然估计,期望/条件最大化算法,平方迭代法,高斯混合模型,自动调制分类。
1.简介
可以将自动调制分类(AMC)定义为从一组给定的可能调制类型中识别出噪声信号的调制类型的过程[1]。 它是信号检测和解调之间的中间步骤,并且在各种军事和民用应用(例如电子战,软件无线电,干扰识别,频谱管理等)中发挥关键作用。
近年来,越来越多的文献关注非高斯噪声下的AMC,因为实验研究表明,大多数无线电信道会同时经历自然噪声和人为噪声,并且组合噪声是高度非高斯过程。 参考文献[2]和[3]提出了基于调制相关特征的AMC。 参考文献[4]和[5]提出了基于分布测试的快速而强大的AMC。 尽管基于特征的分类器和基于分布测试的分类器通常更易于实现,但它们不是最优的。 基于可能性的分类器在贝叶斯意义上是最优的,因为它们将分类错误的可能性降到最低[6]。 在[7]中,非高斯噪声是由N项高斯混合建模的,然后使用混合似然比检验(HLRT)来识别调制格式。
通过使用期望/条件最大化(ECM)算法盲目估计未知模型参数。 由于ECM的收敛速度慢,基于ECM的AMC非常耗时。
在本文中,为了在非高斯噪声下加速AMC,我们提出了一种基于平方迭代法(SQUAREM)来估计ECM的信道系数和高斯混合模型(GMM)参数的新方法[8]。 在学习GMM时,基本SQUAREM(bSQUAREM)将不会保留某些参数的约束,例如 混合比例是非负的,每个高斯分量的协方差矩阵是对称正定的,这将导致无意义的估计。 因此,我们在SQUAREM的每次迭代中都添加了参数检查,我们将其称为带有参数检查(SQUAREM-PC)算法的SQUAREM,它可以加快ECM的收敛速度,并收敛到对数似然函数的固定点。
这篇文章的其余部分安排如下。 第二部分描述了信道模型和调制分类器。
第三节介绍了拟议算法的细节。 第四部分提供了数值结果。 最后,第五节给出结论。
2. 信道模型和调制分类器
令M为大小为m = | M |的线性调制星座图点集。 传输的符号
{
s
t
}
t
=
1
T
\{s_t\} ^T_{ t = 1}
{st}t=1T从M均匀且独立地绘制。经过预处理,匹配滤波器输出处每个符号一个采样处采样的接收信号的基带复包络可以写为
y
t
=
α
s
t
+
ϵ
t
y_t = \alpha s_t +\epsilon _t
yt=αst+ϵt ,t=1,…,T, (1)
其中,α是一个复数因子,用于表示信号经历的平坦衰落以及发射信号的未知功率和载波相位,T表示接收符号的数量。 如[4]中,我们假设
{
s
t
}
t
=
1
T
\{s_t\} ^T_{ t = 1}
{st}t=1T是一组独立的相同分布的(i.i.d)复数随机变量,
ϵ
t
\epsilon _t
ϵt的实部和虚部都是i.i.d。
ϵ
t
\epsilon _t
ϵt可以看作是2 维矢量,包括实部和虚部。 在这里,我们选择N项高斯混合模型来近似
ϵ
t
\epsilon _t
ϵt的概率密度函数(pdf)
其中
λ
n
λ_n
λn是从pdf中的第n个项中选择
ϵ
t
\epsilon _t
ϵt的概率,其中0≤
λ
n
λ_n
λn≤1并且
∑
n
=
1
N
λ
n
=
1
\sum ^ N_{ n = 1}λ_n =1
∑n=1Nλn=1。
∑
n
=
(
σ
n
2
/
2
)
I
\sum_n =(σ^2 _n / 2)I
∑n=(σn2/2)I,其中I表示单位矩阵,
σ
n
2
σ^2_ n
σn2是第n个高斯分量的能量。
AMC的主要工作是通过分析接收信号
{
y
t
}
t
=
1
T
\{y_t\}^T _{t = 1}
{yt}t=1T来从
S
=
{
M
1
,
.
.
.
,
M
C
}
S = \{M _1,...,M_C\}
S={M1,...,MC}中选择调制格式。 最大似然调制分类是一个复合假设检验问题,其中选择最大化
{
y
t
}
t
=
1
T
\{y_t\}^T _{t = 1}
{yt}t=1T的对数似然性的假设,其中
H
i
H_i
Hi是假设接收信号的调制方案为
M
i
M_i
Mi,i = 1,…,C,其中C是可能的调制类型的总数。
通过分析接收信号模型,可以通过下式计算
{
y
t
}
t
=
1
T
\{y_t\}^T _{t = 1}
{yt}t=1T的对数似然
其中
s
t
j
i
s^ i_{ tj}
stji是调制星座图
M
i
M _i
Mi的第j个星座点,
m
i
=
∣
M
i
∣
m_ i = | M_ i |
mi=∣Mi∣ 表示
M
i
M_ i
Mi的大小。
由于预先未知α,
{
λ
n
}
n
=
1
N
,
{
σ
n
2
}
n
=
1
N
\{λ_n\} ^N _{n = 1},\{σ^2_ n\} ^N_ {n = 1}
{λn}n=1N,{σn2}n=1N,因此我们使用混合似然比检验(HLRT),其中通过使用最大似然估计来估计未知参数 假设。 令针对假设
H
i
H_ i
Hi获得的α,
{
λ
n
}
n
=
1
N
,
{
σ
n
2
}
n
=
1
N
\{λ_n\} ^N _{n = 1},\{σ^2_ n\} ^N_ {n = 1}
{λn}n=1N,{σn2}n=1N的估计值由
α
i
,
{
λ
n
i
}
n
=
1
N
,
{
(
σ
n
i
)
2
}
n
=
1
N
,
α_i,\{λ^i_n\} ^N_{ n = 1},\{(σ^i_n)^ 2\}^ N_{ n = 1},
αi,{λni}n=1N,{(σni)2}n=1N,则调制分类器可以表示为
3. 为估计参数而设置的方法
从上面的HLRT分类器的描述中,我们可以看到,计算量最大的部分是针对每种调制类型假设估算模型的未知参数。 在[4]中,通过ECM估计参数。
ECM具有简单性和稳定性,但收敛速度慢。 为了使字母独立,我们在这里放置了由ECM更新的参数方程式。
在这里,我们以假设
H
i
H_ i
Hi为例来说明ECM的更新方程。 我们定义了一组新的变量
{
z
t
}
t
=
1
T
,
z
t
\{z _t\} ^T_{ t = 1},z _t
{zt}t=1T,zt的值表示对
y
t
y _t
yt的噪声分量建模的高斯混合项,因此
z
t
∈
{
1
,
2
,
.
.
.
,
N
}
。
z _t∈\{1,2,...,N\}。
zt∈{1,2,...,N}。 向量
θ
=
[
R
(
α
)
,
I
(
α
)
,
λ
1
,
.
.
.
,
λ
N
,
σ
1
2
,
.
.
.
,
σ
N
2
]
T
θ= [R_{(α)},I_{(α)},λ_1,...,λ_N,σ^2 _1,...,σ^2 _N] ^T
θ=[R(α),I(α),λ1,...,λN,σ12,...,σN2]T表示要估计的参数,
θ
p
=
[
R
(
α
p
)
,
I
(
α
p
)
,
λ
1
p
,
.
.
.
,
λ
N
p
,
(
σ
1
p
)
2
,
.
.
.
,
(
σ
N
p
)
2
]
T
θ^p = [R_{(α^p)},I_{(α^p)},λ^p_1,...,λ^p_N,(σ^p _1)^2,...,(σ^p _N)^2] ^T
θp=[R(αp),I(αp),λ1p,...,λNp,(σ1p)2,...,(σNp)2]T表示当前的θ估计 ,其中
R
(
⋅
)
和
I
(
⋅
)
R(·)和I(·)
R(⋅)和I(⋅)分别表示复数的实部和虚部,为清楚起见,我们省略了参数的上标
“
i
”
“ i”
“i”。 更新公式如下,推导的细节可以在[7]中找到。 为了简洁起见,我们使用
ψ
t
n
j
p
\psi ^p _{tnj}
ψtnjp表示给定观察变量
y
t
y_ t
yt的隐藏变量
z
t
,
s
t
z _t,s _t
zt,st的后验条件概率,即
P
(
z
t
=
n
,
s
t
=
s
t
j
i
∣
y
t
,
θ
p
,
H
i
)
P(z _t = n,s_ t = s ^i_{ tj} | y_ t,θ^p,H_ i)
P(zt=n,st=stji∣yt,θp,Hi)。
根据贝叶斯定理,可以将
ψ
t
n
j
p
\psi ^p _{tnj}
ψtnjp计算为
其中
用于更新
θ
p
θ^p
θp的ECM隐式定义了从参数空间到其自身的映射F,即:
Ω
⊂
R
2
+
2
N
→
Ω
,
Ω\subset \mathbb R^{2 + 2N}→Ω,
Ω⊂R2+2N→Ω,使得
θ
p
+
1
=
F
(
θ
p
)
,
p
=
0
,
1
,
。
.
.
.
θ^{p + 1} = F(θ^p),p = 0,1,。 ...
θp+1=F(θp),p=0,1,。...因此,ECM迭代的目标是找到方程g(θ)的解 F(θ)-θ= 0。
牛顿法可以通过找到围绕
θ
p
θ^p
θp的
g
(
θ
)
g_{(θ)}
g(θ)的线性近似值的零点,来提供二次收敛速度来定位不动点:
g
(
θ
)
=
g
(
θ
p
)
+
M
p
(
θ
−
θ
p
)
g_{(θ)}= g(θ^p)+ M ^p(θ-θ^p)
g(θ)=g(θp)+Mp(θ−θp),其中
M
p
=
J
(
θ
p
)
−
I
,
而
J
(
θ
p
)
M^ p = J(θ^p)-I,而J(θ^p)
Mp=J(θp)−I,而J(θp)是在θp处计算的F(θ)的雅可比行列式。 由于计算
M
p
M^ p
Mp的复杂性,Steffensen型方法[8]提出了
M
p
M ^p
Mp的两点割线近似。 通过将
g
(
θ
)
g(θ)
g(θ)分别围绕
θ
p
和
F
(
θ
p
)
θ^p和F(θ^p)
θp和F(θp)的线性近似写为:
g
0
(
θ
)
=
g
(
θ
p
)
+
(
1
/
δ
p
)
(
θ
−
θ
p
)
,
g
1
(
θ
)
=
g
(
F
(
θ
p
)
)
+
(
1
/
δ
p
)
(
θ
−
F
(
θ
p
)
)
,
这
里
J
(
θ
p
)
和
J
(
F
(
θ
p
)
)
都
近
似
为
(
1
/
δ
p
)
I
+
I
。
g _0(θ)= g(θ^p)+(1 /δ^p)(θ-θ^p),g_ 1( θ)= g(F(θ^p))+(1 /δ^p)(θ-F(θ^p)),这里J(θ^p)和J(F(θ^p))都近似为(1 / δ^p)I + I。
g0(θ)=g(θp)+(1/δp)(θ−θp),g1(θ)=g(F(θp))+(1/δp)(θ−F(θp)),这里J(θp)和J(F(θp))都近似为(1/δp)I+I。
g 0(θ)和g 1(θ)的两个零点如下,它们给出了固定点的两个近似值。
选择步长
δ
p
δ^p
δp以最小化
θ
0
p
+
1
和
θ
1
p
+
1
θ^{p + 1}_ 0和θ^{p + 1}_ 1
θ0p+1和θ1p+1之间的某些差异度量。 在这篇文章中,我们选择差异度量为
−
∥
θ
1
p
+
1
−
θ
0
p
+
1
∥
2
/
δ
p
,
-\parallel θ^{p + 1}_ 1-θ^{p + 1}_ 0\parallel ^ 2 /δ^p,
−∥θ1p+1−θ0p+1∥2/δp,得到
δ
p
=
−
∥
r
p
∥
/
∥
v
p
∥
,
δ^p =- \parallel r^p \parallel/ \parallel v^p \parallel,
δp=−∥rp∥/∥vp∥, 其中
r
p
=
F
(
θ
p
)
−
θ
p
r^p = F(θ^p)-θ^p
rp=F(θp)−θp,
v
p
=
F
(
F
(
θ
p
)
)
−
2
F
(
θ
p
)
+
θ
p
v^p = F(F(\theta ^p)) - 2F(\theta ^p) +\theta ^p
vp=F(F(θp))−2F(θp)+θp和
∥
⋅
∥
\parallel ·\parallel
∥⋅∥表示欧几里得范数。 将(10)与
δ
p
δ^p
δp结合显示出Steffensen型方法来定位不动点。
展开
F
(
θ
)
,
F
(
2
)
(
θ
)
=
F
(
F
(
θ
)
)
F(\theta),F^{(2)}(\theta)=F(F(\theta))
F(θ),F(2)(θ)=F(F(θ))等,在固定点
θ
∗
θ^∗
θ∗附近的泰勒级数中的F(F(θ))等,并在
θ
p
θ^p
θp处进行计算以获得:
其中
e
p
=
θ
p
−
θ
∗
,
J
e^p =θ^p-θ^∗,J
ep=θp−θ∗,J是在
θ
∗
θ^∗
θ∗处计算出的F(θ)的雅可比行列式。 根据(13),
r
p
,
v
p
和
e
p
r ^p,v^ p和e^ p
rp,vp和ep之间的关系如下:
同时,根据(12)和(13),可以得到如下递推误差方程:
通过使用称为“平方”的思想,通过要求递归误差方程满足
e
p
+
1
=
[
I
−
δ
p
(
J
−
I
)
]
2
e
p
+
o
(
e
p
)
e ^{p + 1 }= [I-δ^p(J-I)] ^2 e^ p + o(e^ p)
ep+1=[I−δp(J−I)]2ep+o(ep)来获得SQUAREM算法。
使用(14)和(15),得出SQUAREM算法的迭代方案为
文献[8]中提出的bSQUAREM有一个局限性,即它没有明确考虑参数约束,这将导致无意义的参数估计。 例如,当
(
σ
n
p
)
2
<
0
时
,
某
些
e
x
p
(
−
∣
y
t
−
α
p
s
t
j
i
∣
2
/
(
σ
n
p
)
2
)
(σ^p_n)2 <0时,某些exp(-| y_t-α^ps^i_{tj} |^ 2 /(σ^p_n)^2)
(σnp)2<0时,某些exp(−∣yt−αpstji∣2/(σnp)2)可能太大而无法超出计算机和
ψ
t
n
j
p
ψ^p_{ tnj}
ψtnjp的精度范围(9) )可能毫无意义。 因此,我们应检查由(17)获得的
θ
p
+
1
θ^{p + 1}
θp+1,看它们是否服从约束,即
0
≤
λ
n
p
+
1
≤
1
,
(
σ
n
p
+
1
)
2
>
0
0≤λ^{p + 1}_ n≤1,(σ^{p + 1}_ n)^2>0
0≤λnp+1≤1,(σnp+1)2>0。如果更新的参数违反任何一个 在这些约束条件下,我们将拒绝
θ
p
+
1
并
设
置
θ
p
+
1
=
F
(
F
(
θ
p
)
)
θ^{p + 1}并设置θ^{p + 1} = F(F(θ^p))
θp+1并设置θp+1=F(F(θp))。 这意味着只要可行,我们将采用步长
δ
p
δ^p
δp来加快收敛速度,否则,将
δ
p
=
−
1
δ^p = -1
δp=−1来更新ECM等参数,因此与ECM相比,该方案可以加快收敛速度并收敛。 到对数似然函数的固定点。 为了完成SQUAREM-PC的一次迭代,我们在给定
θ
p
+
1
θ^{p + 1}
θp+1的情况下再计算一个时间F,并将
θ
p
+
1
=
F
(
θ
p
+
1
)
定
义
为
θ
p
θ^{p + 1 }= F(θ^p + 1)定义为θ^p
θp+1=F(θp+1)定义为θp的更新值。
SQUAREM-PC算法总结为算法1。
SQUAREM-PC的复杂度为
O
(
m
i
N
T
f
)
O(m _i NTf)
O(miNTf),其中f表示算法实现收敛时计算映射函数F的数量。
4. 数值结果
在以下实验中,实际信道模型参数定义如下:假定α的振幅为瑞利分布,且
E
[
∣
α
∣
2
]
=
2
,
α
E [|α| ^ 2] = 2,α
E[∣α∣2]=2,α的相位均匀地分布在
(
0
,
2
π
]
(0,2\pi]
(0,2π]中;高斯混合分布中的项数分别取N = 2,3;
当
N
=
2
时
,
我
们
将
λ
1
=
0.9
和
σ
2
2
/
σ
1
2
=
100
,
当
N
=
3
时
,
我
们
设
置
λ
1
=
0.85
,
λ
2
=
0.1
且
σ
2
2
/
σ
1
2
=
50
,
σ
3
2
/
σ
1
2
=
100
;
观
察
符
号
的
数
量
T
=
500
。
当N = 2时,我们将λ_1 = 0.9和σ^2_ 2 /σ^2_ 1 = 100,当N = 3时,我们设置λ_1 = 0.85,λ_2 = 0.1且σ^2 _2 /σ^2_ 1 = 50,σ^2_ 3 /σ^2 _1 = 100; 观察符号的数量T = 500。
当N=2时,我们将λ1=0.9和σ22/σ12=100,当N=3时,我们设置λ1=0.85,λ2=0.1且σ22/σ12=50,σ32/σ12=100;观察符号的数量T=500。
标准化调制星座图的能量,并且将接收到的SNR定义为
S
N
R
=
10
l
o
g
10
(
E
[
∣
α
∣
2
]
/
σ
1
2
)
。
SNR = 10log _{10}(E [|α| ^2] /σ^2_ 1)。
SNR=10log10(E[∣α∣2]/σ12)。
由于期望最大化(EM)和广义EM算法(例如ECM)对参数初始化敏感,因此在这里我们根据[9]中给出的准则执行初始化。 收敛标签ρ被设置为10 -6。 ECM的最大迭代次数设置为6000,并且因为在SQUAREM-PC的一次迭代中,我们需要计算三次映射函数F,所以SQUAREM-PC的最大迭代次数被设置为2000。
首先,研究了bSQUAREM和SQUAREM-PC的性能。 通过计算无用估计数(用N cnt表示)来分析收敛结果。 从表I中我们可以发现SQUAREMPC优于bSQUAREM。 此外,我们研究了在SQUAREM-PC的整个迭代中平均参数违反约束次数的次数。 完整的一次迭代中违反时间的平均百分比显示在表II中。 因此,我们需要在每次迭代中进行参数检查,以确保SQUAREM算法将收敛到对数似然函数的固定点。
其次,我们比较了SQUAREM-PC和ECM的收敛速度。 选择16-QAM作为发送调制类型。 将计算映射函数F的平均数(用F cnt表示)作为性能指标。 从图1中可以看出,SQUAREM-PC的收敛速度比ECM快。
两种算法的复杂度与F cnt成线性关系,因此SQUAREM-PC的复杂度低于ECM。
第三,研究了基于SQUAREM-PC或ECM的分类器的准确性和速度。 所考虑的调制方案是BPSK,QPSK,8-PSK和16-QAM,它们被认为具有同等的可能性。 通过使用由
P
c
c
=
1
/
C
∑
i
=
1
C
P
(
H
=
H
i
∣
H
i
)
P_ {cc} = 1 / C\sum^C_{ i = 1} P(H = H _i | H_ i)
Pcc=1/C∑i=1CP(H=Hi∣Hi)定义的正确分类的平均概率P cc来评估分类器的准确性。
H
i
H _i
Hi是发送信号的调制类型。
当N = 2,3时,基于SQUAREM-PC或ECM的分类器的精度分别如图2和图3所示。 同时,研究了具有已知参数的最大似然(ML)分类器的
P
c
c
P_cc
Pcc,具有已知参数的基于一样本正交的2D K-S分类器[4]和具有ECM估计参数的基于一样本正交的2D K-S分类器。 通过使用由
t
m
c
=
1
/
C
∑
i
=
1
C
t
m
c
i
t_{mc}=1/C\sum^C_{i=1}t^i_{mc}
tmc=1/C∑i=1Ctmci定义的调制分类的平均时间
t
m
c
t _{mc}
tmc来评估分类器的速度。 其中
t
m
c
i
t ^i_{ mc}
tmci表示当发射信号的调制类型为
H
i
H_ i
Hi时的分类器时间。 表III列出了基于SQUAREM-PC或ECM的分类器的
t
m
c
t_ {mc}
tmc。 仿真实验是通过在装有Intel®Xeon®Platinum 8163 CPU和2.50GHz CPU Clock Speed的计算机上运行的Matlab进行的。 因此,基于SQUAREM-PC的分类器在不降低准确性的情况下加快了基于ECM的分类器的速度。 从图2和图3中我们可以发现,当SNR高时,基于SQUAREM-PC的分类器的准确性甚至比基于ECM的分类器的准确性稍高。 对于这种现象的解释可能是,当SNR高时,与使用相同初始化的ECM相比,SQUAREM-PC更有可能收敛到对数似然函数的全局最大点。 解释它的理论将来需要研究。
5.结束语
通过以上实验,我们可以得出结论:在平坦衰落的非高斯信道中盲目估计信道参数时,SQUAREM-PC的收敛速度比ECM快,并且在不损失分类的准确性的基础上,基于SQUAREM-PC的AMC比基于ECM的AMC更快。
[1] O. A. Dobre, A. Abdi, Y. Bar-Ness, and W. Su, “Survey of automatic
modulation classification techniques: Classical approaches and new
trends,” IET Commun., vol. 1, no. 2, pp. 137–156, Apr. 2007.
[2] Z. Zhu and A. K. Nandi, “Blind digital modulation classification
using minimum distance centroid estimator and non-parametric like-
lihood function,” IEEE Trans. Wireless Commun., vol. 13, no. 8,
pp. 4483–4494, Aug. 2014.
[3] O. A. Dobre, A. Abdi, Y. Bar-Ness, and W. Su, “Cyclostationarity-based
modulation classification of linear digital modulations in flat fading
channels,” Wireless Pers. Commun., Int. J., vol. 54, no. 4, pp. 699–717,
Sep. 2010.
[4] F. Wang and X. Wang, “Fast and robust modulation classification via
Kolmogorov–Smirnov test,” IEEE Trans. Commun., vol. 58, no. 8,
pp. 2324–2332, Aug. 2010.
[5] F. Wang, O. A. Dobre, C. Chan, and J. Zhang, “Fold-based Kolmogorov–
Smirnov modulation classifier,” IEEE Signal Process. Lett., vol. 23,
no. 7, pp. 1003–1007, Jul. 2016.
[6] S. M. Kay, Fundamentals of Statistical Signal Processing: Detec-
tion Theory, vol. 2. Upper Saddle River, NJ, USA: Prentice-Hall,
1993.
[7] V. G. Chavali and C. R. C. M. D. Silva, “Maximum-likelihood clas-
sification of digital amplitude-phase modulated signals in flat fad-
ing non-Gaussian channels,” IEEE Trans. Commun., vol. 59, no. 8,
pp. 2051–2056, Aug. 2011.
[8] R. Varadhan and C. Roland, “Simple and globally convergent methods
for accelerating the convergence of any EM algorithm,” Scand. J. Statist.,
vol. 35, no. 2, pp. 335–353, 2008.
[9] R. J. Kozick and B. M. Sadler, “Maximum-likelihood array processing
in non-Gaussian noise with Gaussian mixtures,” IEEE Trans. Signal
Process., vol. 48, no. 12, pp. 3520–3535, Dec. 2000.
Authorized licensed use limited to: SICHUAN UNIVERSITY. Downloaded on December 17,2020 at 11:48:21 UTC from IEEE Xplore. Restrictions apply.