kmp算法简单理解:
kmp算法最重要应该是算出部分匹配表:
部分匹配表就是寻找最长前缀后缀
ABAABAAAB
部分匹配表为: 001 12 3 412
假如要匹配的字符串为: ABAABAABB 倒数第二个B和A不匹配,就要使用这个不匹配的B前面的ABAABAA找最大的前缀后缀:ABAA,所以部分匹配表A下面的4就是回到ABAA下,再用回溯的索引的下一个值和被匹配的当前值做对比,如果还是不对,就在从ABAA中找最大的前缀和后缀:A,一直往下...
寻找最长前缀后缀
如果给定的模式串是:“ABCDABD”,从左至右遍历整个模式串,其各个子串的前缀后缀分别如下表格所示:
计算部分匹配表:
private int[] getKmpPartPattern2(String str) {
int[] next = new int[str.length()];
//第一个值为0
next[0] = 0;
char[] p = str.toCharArray();
for(int i=1,j=0;i<str.length();i++) {
//这是kmp算法的核心,也就是上面描述的如果遇到不相等的就找前面相等的回溯到前后缀最大值的地方
while(j>0 && p[i] != p[j]) {//EFCABEFCA
j = next[j-1];
}
if(p[i] == p[j]) {
++j;
}
next[i] = j;
}
return next;
}
/**
* 第一种方法是把j回溯到next[j-1],就和当前的i做比较一直到比较成功为止
* @param str1 被匹配字符串
* @param str2 匹配字符串
* @param next 部分匹配表
* @return
*/
public int kmpSeach(String str1,String str2,int[] next) {
for(int i = 0,j=0;i < str1.length();i++) {
while(j >0 && str1.charAt(i) != str2.charAt(j)) {
j = next[j-1];
}
if(str1.charAt(i) == str2.charAt(j)) {
j++;
}
if(j == str2.length()) {
return i - j + 1; //这里返回的是索引
}
}
return -1;
}