0 总述
DTW可以计算两个时间序列的相似度,尤其适用于不同长度、不同节奏的时间序列(比如不同的人读同一个词的音频序列)
DTW将自动扭曲(warping)时间序列(即在时间轴上进行局部的缩放),使得两个序列的形态尽可能的一致,得到最大可能的相似度。
DTW采用了动态规划的方法来进行时间规整的计算
1 欧几里得距离的局限性
描述两个序列之间的相似性,欧氏距离是一种十分简单且直观的方法,但对于序列之间步调不统一的情况,计算欧氏距离得到的结果会比实际的最小距离大很多,比如下面两个几乎一样的序列:
·
左边是欧氏距离的对应关系,在同一时刻上的点相互对应,计算总距离;右边是DTW的点对应关系。
可以看到,下面序列某时刻的点可以对应上面序列非同一时刻的点;同时一个点可以对应多个点;多个点也可以对应一个点,也就是说每个点尽可能找离它距离最小的点,允许时间轴上的伸缩。
显而易见的,这种情况下DTW计算的距离比欧氏距离更小。因此对于时间上有拉伸或压缩的序列,使用DTW计算的序列距离更加合理。
该算法在语音序列匹配中使用十分广泛。
2 DTW 算法
假设我们有两个时间序列Q和C,他们的长度分别是n和m(n和m不一定相等),我们记为:
现在我们需要将两个序列对齐,DTW采用动态规划的方法进行对齐。
为了对齐这两个序列,我们需要构造一个n*m的矩阵网络,矩阵元素(i,j)表示和两个点之间的距离
【不同的应用问题中,会有不同的d】
【一般采用欧氏距离,】
【在有些问题中,这个距离又被称作失真度】
DTW算法旨在寻找一条通过此网络中若干个点的一条路径,路径中的经过的点即为两个序列之间进行计算所需要的对齐的点
但是,这条路径并不是随意选择的,它需要满足几个约束条件:
- 边界条件【,】,首尾需要对齐
- 连续性+单调性【如果,那么对于路径上的下一个点,需要满足,】【也就是路径只能连接正上方、正右方、右上方三个相邻点钟的一个】【】——>保证两个要比较的序列Q和C中的每一个坐标都会在W中出现
我们的目的是最小化路径上的值,即
【有时候也没有这个K)
分母中的K主要是用来对不同的长度的规整路径做补偿。因为不同的路径其长短不同,较长的路径有较多的“点对”,会有较多的距离累加上去,所以总距离除以K得到单位路径的距离。
3 DTW 举例
比如我们有两个序列
import matplotlib.pyplot as plt import numpy as np a=np.array([1,3,2,4,2]) b=np.array([0,3,4,2,2]) plt.plot(a) plt.plot(b)
他们之间的欧氏距离为
np.sqrt(np.sum((a-b)*(a-b)) #3
使用DTW的话,先要计算两个序列之间的欧氏距离
a-b 0 3 4 2 2 1 1 2 3 1 1 3 3 0 1 1 1 2 2 1 2 0 0 4 4 1 0 2 2 2 2 1 2 0 0
使用动态规划的话,就需要有这样的状态转移方程:
其中d(i,j)就是第(i,j)个条目里面的内容,也就是ai和bj之间的欧几里得距离
a-b | 0 | 3 | 4 | 2 | 2 |
1 | 1 dp(0,0) =d(0,0) =1 |
2 dp(0,1) =dp(0,0)+d(0,1) =1+2=3 |
3 dp(0,2) =dp(0,1)+d(0,2) =3+3=6 |
1 dp(0,3) =dp(0,2)+d(0,3) =6+1=7 |
1 dp(0,4) =dp(0,3)+d(0,4) =7+1=8 |
3 | 3 dp(1,0) =dp(0,0)+d(1,0) =1+3=4 |
0 dp(1,1) =min(dp(0,0) ,dp(1,0) ,dp(0,1)) +d(1,1) =1+0=1 |
1 dp(1,2) =min(dp(0,1) ,dp(1,1) ,dp(0,2)) +d(1,2) =1+1=2 |
1 dp(1,3) =min(dp(0,2) ,dp(1,2) ,dp(0,3)) +d(1,3) =2+1=3 |
1 dp(1,4) =min(dp(0,3) ,dp(1,3) ,dp(0,4)) +d(1,4) =3+1=4 |
2 | 2 dp(2,0) =dp(1,0)+d(2,0) =3+2=5 |
1 dp(2,1) =min(dp(1,0) ,dp(2,0) ,dp(1,1)) +d(2,1) =1+1=2 |
2 dp(2,2) =min(dp(1,1) ,dp(2,1) ,dp(1,2)) +d(2,2) =1+2=3 |
0 dp(2,3) =min(dp(1,2) ,dp(2,2) ,dp(1,3)) +d(2,3) =2+0=2 |
0 dp(2,4) =min(dp(1,3) ,dp(2,3) ,dp(1,4)) +d(2,4) =2+0=2 |
4 | 4 dp(3,0) =dp(2,0)+d(3,0) =5+4=9 |
1 dp(3,1) =min(dp(2,0) ,dp(3,0) ,dp(2,1)) +d(3,1) =2+1=3 |
0 dp(3,2) =min(dp(2,1) ,dp(3,1) ,dp(2,2)) +d(3,2) =2+0=2 |
2 dp(3,3) =min(dp(2,2) ,dp(3,2) ,dp(2,3)) +d(3,3) =2+2=4 |
2 dp(3,4) =min(dp(2,3) ,dp(3,3) ,dp(2,4)) +d(3,4) =2+2=4 |
2 | 2 dp(4,0) =dp(3,0)+d(4,0) =9+2=11 |
1 dp(4,1) =min(dp(3,0) ,dp(4,0) ,dp(3,1)) +d(4,1) =3+1=4 |
2 dp(4,2) =min(dp(3,1) ,dp(4,1) ,dp(3,2)) +d(4,2) =2+2=4 |
0 dp(4,3) =min(dp(3,2) ,dp(4,2) ,dp(3,3)) +d(4,3) =2+0=2 |
0 dp(4,4) =min(dp(3,3) ,dp(4,3) ,dp(3,4)) +d(4,4) =2+0=2 |
计算出所有的dp值之后,就可以得到它的DTW值,也即2
4 python 实现
dtw_lst=[[-1 for _ in range(len(b))] for _ in range(len(a))]
#DTW矩阵,也就是上例中的dp(i,j)
def dist(i,j):
return(math.fabs(a[i]-b[j]))
#两个点之间的欧几里得距离
dtw_lst[0][0]=dist(0,0)
def DTW(i,j):
if(dtw_lst[i][j]!=-1):
return(dtw_lst[i][j])
#表示之前已经计算过这一对(i,j)的dtw了
else:
dtw_prev=np.inf
if(i!=0):
dtw_prev=min(dtw_prev,DTW(i-1,j))
if(j!=0):
dtw_prev=min(dtw_prev,DTW(i,j-1))
if(i!=0 and j!=0):
dtw_prev=min(dtw_prev,DTW(i-1,j-1))
#由于不知道有没有左上,左,和上的点,所以需要讨论
dtw_lst[i][j]=dtw_prev+dist(i,j)
return(dtw_lst[i][j])
DTW(len(a)-1,len(b)-1)
#2.0
和手推的结果是一样的
参考资料
理解dynamic time warping(DTW)的基本思想 - 知乎 (zhihu.com)