Sunday 字符串匹配算法

Sunday 算法 是 Daniel M.Sunday 于 1990 年提出的字符串模式匹配。

其效率在匹配随机的字符串时不仅比其它匹配算法更快,而且 Sunday 算法 的实现比 KMP、BM 的实现容易很多!

Sunday 算法 与 KMP 算法 一样是从前往后匹配,在匹配失败时关注的是主串中参加匹配的最末位字符的下一位字符。

  • 如果该字符没有在模式串中出现则直接跳过,即移动位数 = 模式串长度 + 1;

  • 否则,其移动位数 = 模式串长度 - 该字符最右出现的位置(以0开始) = 模式串中该字符最右出现的位置到尾部的距离 + 1。

举个例子来理解一下它的操作过程。

假定现在要在主串substring searching xiaowu 中查找模式串 search 。

1.刚开始时,把模式串与文本串左边对齐:

Sunday 字符串匹配算法

 

 

Sunday 字符串匹配算法

 

 

2.结果发现在第 2 个字符处发现不匹配,不匹配时关注文本串中参加匹配的最末位字符的下一位字符,即绿色的字符 i,因为模式串 search 中并不存在 i,所以模式串直接跳过一大片,向右移动位数 = 匹配串长度 + 1 = 6 + 1 = 7,从 i 之后的那个字符(即字符 n)开始下一步的匹配,如下图:

Sunday 字符串匹配算法

3.结果第一个字符就不匹配,再看文本串中参加匹配的最末位字符的下一位字符,是 'r' ,它出现在模式串中的倒数第 3 位,于是把模式串向右移动  3  位( r  到模式串末尾的距离 + 1 = 2 + 1 =3),使两个 'r' 对齐,如下:

Sunday 字符串匹配算法

 

 

Sunday 字符串匹配算法

 

 

Sunday 字符串匹配算法

 

Sunday 字符串匹配算法

 

 

 

4.匹配成功。

 回顾整个过程,我们只移动了两次模式串就找到了匹配位置,缘于 Sunday 算法每一步的移动量都比较大,效率很高。

 

本文转自:https://mp.weixin.qq.com/s/0MwBmyc_FeE0SKCO700cjQ 

参考:字符串匹配算法之Sunday算法: https://www.jianshu.com/p/2e6eb7386cd3

上一篇:如何使用gitbook写文档


下一篇:July 7th, 2019. Week 27th, Sunday