Manacher算法
背景介绍:
很多类似于如下的问题:
给定一个字符串,求出该字符串的最大回文长度.
比如:
s = "abba"
s = "hjkjh"
等.
如果用传统的方法进行暴力比较,以其中的每个字符为中心,两边逐渐对比,效率很差.复杂度是O(n^2)
后来有人提出了manacher算法(马拉车算法)
该算法的基本原理是:给定一个字符串hoabccccbacc,然后在该字符串内插入该字符串不曾出现的字符(比如:#),生成一组新的字符串
#h#o#a#b#c#c#c#cb#a#c#c#。为了防止越界,在最开始的地方插入一个特殊字符(比如:$)。于是乎,新的字符串就变成了$#h#o#a#b#c#c#c#cb#a#c#c#.这里插入后#之后,不管原来的字符串是偶数个还是奇数,最后都变成了奇数个.
在开始介绍该算法之前,先介绍两个变量.
p[i]:以第i个字符为中心的最大会问半径
mx:i+p[i],他是第i个字符最大回文半径的右边界.
第一步是造新的字符串:代码如下:
char* palindromic::insert(char *s)
{
char *s_new = new char[1024];
int len = strlen(s);
s_new[0] = '$';
s_new[1] = '#';
int j = 2;
for (int i = 0; i < len; i++)
{
s_new[j++] = s[i];
s_new[j++] = '#';
}
s_new[j] = '\0'; // 字符串数组的结束
return s_new; // 返回 s_new 的长度
}
这里返回的就是我们上面提到的类似于$#h#o#a#b#c#c#c#cb#a#c#c#的字符串.
接下来就是对该字符串进行操作,也就是manacher算法.
int palindromic::manacher(char *s)
{
char *s_new = insert(s);
int len = strlen(s_new);
int *p = new int[len];
int max_len = -1;
int id;
int mx = 0;
for (int i = 1; i < len; i++)
{
if (i < mx)
p[i] = min(p[2 * id - i], mx - i); //(这里的解释请着重看下面的红色部分文字)
else
p[i] = 1;
while (s_new[i - p[i]] == s_new[i + p[i]]) // 不需边界判断,因为左有'$',右有'\0'
p[i]++;
if (mx < i + p[i])//更新右边界
{
id = i;
mx = i + p[i];
}
max_len = max(max_len, p[i] - 1);
}
return max_len;
}
这里面最核心的也是最难理解的部分就是这行代码:
p[i] = min(p[2 * id - i], mx - i); //(这里的解释请着重看下面的红色部分文字)
当i<mx。也就是目前处于如下图所示的状态:
虚线就是mx的位置,他是id的边界.j是i以id为中心的对称位置(2*id-i)
首先
只讨论当 i<mx的时候这种情况
重点:
A:2和3他一定是以id为中心对称的
B:1和4也一定是以id为中心对称的
C:1和2是以j为中心对称的
D:3和4是以i为中心对称的.
E:i和j是以id为中心对称的.
现在要求p[i]的初始值,那么他必须被约束在上述的范围内.
第一步:这里p[j]是在此之前就已经计算出来的结果.而i和j是关于id对称,这就必须要让p[i]=p[j].
可以自己举一个非常简单的例子,如果p[i]≠p[j]
a b c(j) b a .......(id).......k.b c(i) b l
这里p[i]=1, p[j] = 2,不相等,根本就无法满足id为中心左右对称的条件,因此必须得让p[i]=p[j]
但是呢?如果p[i]能没有限制的大吗?显然是不可以的.看下图:
假设d是多出来的那部分,那么以i为中心的对立面会有一个c跟他一样。而c和b又是以id为对称的,那么以j为中心的回文半径内会有一段与c对应的b,同理也就会存在以j为中心的对称的部分a.
可问题是我们在前面就已经计算出来了id的回文右边界是mx,但现在的回文范围已经是mx+最下面的两条紫线.这明显是不对的.
因此 p[i]的初始值要么是p[j],要么mx-i。只要取其中的最小值,就可以满足情况.
其余的代码就比较简单,这里就不再费事儿了.