中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

作为最古老的竞技游戏之一,围棋吸引着一批又一批的人类智者,对其进行前赴后继的探索。围棋当中双方的信息完全公开,理论上必然存在一种必胜策略。而掌握这种必胜策略者,就是人们心目中的“围棋上帝”。必胜策略的第一步棋,又被称作为“天元一目”。由于围棋每一步都有着比国际象棋等其他竞技游戏更多的走法,导致寻求围棋最佳走法不可避免地陷入组合爆炸的局面。因此,无论是人类,还是当前的计算机都无法找到必胜策略。正是如此,围棋这种必胜策略深深地隐藏于广阔的未知之中,吸引了一批又一批智者在不断追寻。

随着互联网的普及和围棋培训体系的完善,现代围棋选手的水平已经远超过了古代棋手。即便如此,一位著名的日本棋手说过,如果“围棋上帝”存在的话,那么现代顶尖棋手与“围棋上帝”仍存在让二子的巨大差距。“围棋上帝”一直存在于棋手们的想象当中,成为棋手们毕生追求的目标。AlphaGo 的升级版本 Master 这一次重新出现在公众视野面前,以 60 战全胜的战绩横扫了现役职业顶尖高手,包括柯洁 / 井山裕太 / 朴廷桓这三位中日韩现役
第一人。从这 60 盘棋来看,Master 已充分展现了自己在计算上的优势,而职业棋手们对局后也都纷纷表示跟目前这位“Master”差距太大。柯洁在自己的微博上写下了这样一段话:“人类数千年的实战演练进化,计算机却告诉我们人类全是错的。我觉得,甚至没有一个人沾到围棋真理的边。但是我想说,从现在开始,我们棋手将会结合计算机,迈进全新的领域达到全新的境界。”可见,目前升级版的 AlphaGo 是最接近职业棋手想象中的“围棋上帝”,让人们真正感受到了“上帝视角”。

中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

根据之前在 Nature 上发表的 AlphaGo的论文来看,AlphaGo 并没有采用暴力搜索的方式来寻找最优方案,而是采用经过大量棋局训练的策略神经网络和价值神经网络来搜索胜率最大的走法。也就是说,如果 AlphaGo 真的是“围棋上帝”,它通过启发式搜索的方式找到或者逼近了必胜策略。这似乎预示出一个令人振奋的事实:深度神经网络有可能找到任何公开信息问题的最优解!果真如此,这是否意味着深度神经网络可以解决人类智慧能够解决的很多问题,甚至远远超过人类。无独有偶,最近 Google 在另一个人工智能项目中,利用深度神经网络来识别唇语,其正确率远超过人类唇语专家。其实,以 DeepMind 为代表的人工智能正在向更多的领域渗透,人工智能的广泛应用直接催生了人类社会的第四次工业革命。

当然,深度神经网络的研究依然任重道远。虽然,各种新设计的深度神经网络不断地刷新了机器学习的水平,但还没有人能从理论上完美解释其隐含的机理。当前,对深度神经网络有比较深刻的理论分析的研究工作,当属 NIPS 最新发表的一篇论文,论证了线性神经元的深度神经网络在求解最优化问题上的理论正确性。而目前经常用到的 CNN(卷积神经网络)和 RNN(循环神经网络)等都远比线性神经元要复杂。同时,深度神经网络由于需要大量的训练样本的植入,在训练过程中需要不断地调整参数,来获得想要的输出。比如,AlphaGo 的监督式学习训练出来的策略网络,就需要人类的棋局作为训练样本,而且训练过程中也需要人工设定特征参数。在这样的情况下,神经网络与世界之间的对应关系,仍然是人为设定,而不是神经网络自主生成的。此外,深度神经网络还不具有逻辑推演的能力,而是搞超大规模
的训练数据来拟合真实场景。以 AlphaGo为例,AlphaGo通过学习了几千万局的对弈,并对这些局面进行统计分析,然后才达到了目前的棋力。但人类顶尖棋手通常要达到同等程度的棋力,只需要下几千盘棋,不到 AlphaGo 的万分之一。因此,AlphaGo的学习效率仍然十分低下,这说明,它仍然没有触及到人类智能中最本质的部分。也就是说,目前的神经网络还不具有推演的能力,不像人类能够从少量的案例中学习到现象背后的内在规律,并且将规律推广到更多的场景当中。举个通俗的例子,我们常说聪明的人学什么都很快,也就是说人类可以将不同问题上的经验迁移到新的问题上,但是目前看来,深度神经网络还不具备这样的能力。

当前机器学习界的另一个流派——概率图流派,或许更符合人类的思维习惯。它将内在逻辑利用概率关系设计到模型当中,然后利用少量的数据就能训练出可以拟合大量场景的模型。譬如,Nature 的一篇论文就是利用概率图模型模仿人类书法,并通过图灵测试。不过,当前深度神经网络实在太过热门,导致了概率图流派一直没有得到充足的媒体曝光。不过可以想象,未来的强人工智能很有可能是二者的有机融合。虽然目前相关研究寥寥无几,但是其中蕴含的可能性还是非常值得我们期待的。

“围棋上帝”Master 的出现,表面看起来是机器的胜利,其实背后隐藏着人类
的智慧,说到底还是人类的胜利。期待通过人类科学家的不断努力探索,强人工智能时代尽早到来。

中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

北京工业大学教授,博士生导师,长江学者特聘教授,国家杰出青年基金获得者。中国人工智能学会常务理事、科普工作委员会主任。长期从事神经网络结构分析与自组织设计、计算智能与智能优化控制等研究工作,在智能特征建模、自组织控制和多目标动态优化方面取得了系列创新性成果。