最近在做数据平滑相关的工作,正好读到该篇博客,感觉不错,就翻译了一下。原链接:An Introduction to Signal Smoothing
信号平滑简介
噪声无处不在,不管是在采集手机游戏的加速度数据还是在测量房间的温度,都会引入误差。即使我们有能力消除所有的误差,测量的结果依旧包含一定程度的不确定性。假如玩家随意点击了一下手机屏幕,他们到底想点击哪里是不确定的。所有这些问题都强迫我们重新思考数据的采集和预处理。
1. 简介
滤波器是寻找产生观测数据最可能信号的数学工具。它可以对渗透进传感器的噪声和不确定性进行消除。当前的各种设备,如触屏、游戏手柄、手机和游戏控制器等都是通过传感器采集用户的输入,所以这些设备都不可避免地会引入噪声。所以滤波器在用户体验上扮演着非常重要的角色。
本博客会介绍关于平滑滤波器的基本知识。将这些知识应用到游戏中会极大提升游戏体验。
2. 噪声信号
用一个简单例子来解释噪声是如何干扰信号的。假设一个传感器每隔固定时间采样一下数据,在时刻i产生观测值Si。如果你是游戏开发者,这个传感器很可能是一个控制器,得到的数据可能为:Input.GetAxis("Vertical")
。如果你是一个电子工程师,这个传感器可能是电位计,用来测量电压: analogRead(3)
。这些时间序列都有一个共同点:都被噪声干扰。下图展示了一个被噪声污染的信号:
在这个例子中,噪声被人工添加到原始信号中。针对原始信号的每一个点Si加上一个随机值:
如果满足上面的条件,我们就说噪声是满足可加性的,并且是均匀分布的。这时添加的噪声就独立于原始信号。满足可加性的一致性噪声通常来源于固定的外部干扰。
3. 滑动平均(Moving Average)
是否能重构被噪声污染的信号呢?答案是:看情况。这依赖于噪声的类型和幅度。减弱噪声的最简单方法被称为滑动平均。该方法基于这样一个假设:独立的噪声不会改变信号的基本结构。如果假设成立,则求几个连续点的平均值就可以减弱噪声。正如其名字所表示的,滑动平均就是求给定点和其邻居的平均值作为信号值。例如,我们对三个点求平均值,则过滤之后的信号为:
当获得所有的观测值之后,我们可以定义窗口大小为N=2K+1的滑动平均为:
在下图中,用窗口大小为6的滑动平均对上图的信号进行处理:
可以看出,原始信号几乎被完整地恢复出来。如果你是开发者,可以用下面的代码实现上述过滤:
public float [] MovingAverage (float [] data, int size)
{
float [] filter = new float [data.length];
for (int i = points/2; i < data.length-points/2; i++)
{
float mean = 0;
for (var j = -points/2; j < points/2; j++)
mean += data[i + j];
filter[i] = mean / size;
}
return filter;
}
增加窗长可以进一步减弱噪声的影响,但同时也会使原始信号过度平滑。滑动平均特别适合于连续和平稳的信号。如果信号变化较为剧烈,滑动平均可能会使原始信号的变化大于噪声的消除(也即功不抵过)。
上图中,虽然滑动平均减小了信号的变化程度,但是完美地重构了信号的线性部分。当我们在处理包含可加性噪声的线性信号时,滑动平均是最好的选择。当然,上面的例子也过于理想化,在实际中很难出现。
4. 中心化的滑动平均
上面介绍的滑动平均有个限制:窗口长度N必须为奇数。这样计算的平均值就满足对称性。假如窗口长度N=2k为偶数,此时我们有两种平滑方法(假定k=2):
上述两个公式都是合法的,没有特别的偏向性。所以我们可以对这两个公式求平均值,获得一个中心化的滑动平均,这通常被称为2×4MA。
上面的结果特别像以Ni为中心的滑动平均,但是和前面介绍的滑动平均还是不同的。
5. 加权滑动平均
滑动平均中每个点的权重是相同的,一个更加合理的选择是对靠近Si的点赋予更大的权重,这就是加权滑动平均:
Wj的和必须等于1。
针对加权滑动平均,可以对前面的滑动平均代码进行下面的修改:
for (var j = -points/2; j < points/2; j++)
mean += data[i + j] * weights[j+points/2];
回过头来重看中心化的滑动平均,我们就可以说2×4MA其实就是权重为1/8,1/4,1/4,1/4,1/8的加权滑动平均。
加权的方法不可思议得有效,但是引入了更多的参数。如果你对泛函分析很了解,可能很容易将上面的操作联想到卷积操作符上。通过仔细地挑选权重可以带来很多有趣的性质,例如实现边缘检测或者高斯模糊等。
举一个边缘检测的例子,我们对一个方波执行墨西哥帽小波的卷积操作,需要做的就是将权重设置为下述函数上的点:
然后代码修改成:
float[] kernel = new float[10];
for (int i = 0; i <= kernel.length; t ++)
{
float t = i +4;
kernel[i] = (1-(t*t)) * Math.exp(-(t*t)/2);
}
上述卷积函数可以用来进行边缘检测。如果你是一个游戏开发者,上述方法可以用来检测玩家的突然移动,这通常是运动检测的第一步。
6. 结论
本博客介绍了信号中的噪声问题以及两种解决方法。需要记住一点,没有一种方法是完美的,每个方法都有其优缺点,我们需要知道它们的适用范围。