Manacher算法

背景介绍:

很多类似于如下的问题:

给定一个字符串，求出该字符串的最大回文长度.

比如:

s = "abba"

s = "hjkjh"

等.

如果用传统的方法进行暴力比较，以其中的每个字符为中心，两边逐渐对比，效率很差.复杂度是O(n^2)

后来有人提出了manacher算法(马拉车算法)

该算法的基本原理是：给定一个字符串hoabccccbacc，然后在该字符串内插入该字符串不曾出现的字符(比如:#)，生成一组新的字符串

#h#o#a#b#c#c#c#cb#a#c#c#。为了防止越界，在最开始的地方插入一个特殊字符(比如：$)。于是乎,新的字符串就变成了$#h#o#a#b#c#c#c#cb#a#c#c#.这里插入后#之后，不管原来的字符串是偶数个还是奇数，最后都变成了奇数个.

在开始介绍该算法之前，先介绍两个变量.

p[i]:以第i个字符为中心的最大会问半径

mx:i+p[i]，他是第i个字符最大回文半径的右边界.

第一步是造新的字符串:代码如下：

char* palindromic::insert(char *s)
{
	char *s_new = new char[1024];
    int len = strlen(s);
    s_new[0] = '$';
    s_new[1] = '#';
    int j = 2;

    for (int i = 0; i < len; i++)
    {
        s_new[j++] = s[i];
        s_new[j++] = '#';
    }

    s_new[j] = '\0';  // 字符串数组的结束
    
    return s_new;  // 返回 s_new 的长度
}

这里返回的就是我们上面提到的类似于$#h#o#a#b#c#c#c#cb#a#c#c#的字符串.

接下来就是对该字符串进行操作，也就是manacher算法.

int palindromic::manacher(char *s)
{
	char *s_new = insert(s);
    int len = strlen(s_new);
    int *p = new int[len];
	int max_len = -1;  

    int id;
    int mx = 0;

    for (int i = 1; i < len; i++)
    {
        if (i < mx)
            p[i] = min(p[2 * id - i], mx - i);  //(这里的解释请着重看下面的红色部分文字)
        else
            p[i] = 1;

        while (s_new[i - p[i]] == s_new[i + p[i]])  // 不需边界判断，因为左有'$',右有'\0'
            p[i]++;
        
        if (mx < i + p[i])//更新右边界
        {
            id = i;
            mx = i + p[i];
        }

        max_len = max(max_len, p[i] - 1);
    }

    return max_len;
}

这里面最核心的也是最难理解的部分就是这行代码:

p[i] = min(p[2 * id - i], mx - i); //(这里的解释请着重看下面的红色部分文字)
当i<mx。也就是目前处于如下图所示的状态:

Manacher算法

虚线就是mx的位置，他是id的边界.j是i以id为中心的对称位置(2*id-i)

首先

只讨论当 i<mx的时候这种情况

重点：

A：2和3他一定是以id为中心对称的

B：1和4也一定是以id为中心对称的

C：1和2是以j为中心对称的

D：3和4是以i为中心对称的.

E：i和j是以id为中心对称的.

现在要求p[i]的初始值，那么他必须被约束在上述的范围内.

第一步：这里p[j]是在此之前就已经计算出来的结果.而i和j是关于id对称，这就必须要让p[i]=p[j].

可以自己举一个非常简单的例子，如果p[i]≠p[j]

a b c(j) b a .......(id).......k.b c(i) b l

这里p[i]=1, p[j] = 2,不相等，根本就无法满足id为中心左右对称的条件，因此必须得让p[i]=p[j]

但是呢？如果p[i]能没有限制的大吗？显然是不可以的.看下图：

Manacher算法

假设d是多出来的那部分，那么以i为中心的对立面会有一个c跟他一样。而c和b又是以id为对称的，那么以j为中心的回文半径内会有一段与c对应的b，同理也就会存在以j为中心的对称的部分a.

可问题是我们在前面就已经计算出来了id的回文右边界是mx，但现在的回文范围已经是mx+最下面的两条紫线.这明显是不对的.

因此 p[i]的初始值要么是p[j]，要么mx-i。只要取其中的最小值，就可以满足情况.

其余的代码就比较简单，这里就不再费事儿了.

相关推荐