KMP模式匹配算法

KMP匹配算法,相比朴素匹配算法,可以大大避免重复遍历的情况。KMP匹配算法在匹配不相同时,不是重新返回开始处进行比较,而是退回尽可能远的字串位置在进行比较,这样可以大大减少重复比较。
KMP匹配算法关键在于求出串应该退回的地方,在KMP匹配算法中,定义了一个next数组进行记录串应该返回的地方。next数组的长度为子串的长度,其推导方法为:
KMP模式匹配算法
求next数组代码为:
KMP模式匹配算法
求next数组其实就相当于求前几个字符的最大的相同的前后缀,进而减少匹配的次数。
KMP算法仅当字串与主串存在许多部分匹配时才会有其优势,否则与朴素匹配算法之间差异并不明显。
其中next数组可以进一步改进,在原next数组中仍有很多无用的比较,可以进一步优化,代码如下:
KMP模式匹配算法
对于串T=“ababaaaba“,原next数组值为“001123112”,改进后的next数组值为“001013101”.