AlphaGo Zero ( 阿尔法元 ) 简介

阿尔法元是Deepmind围棋软件AlphaGo的一个版本。AlphaGo团队于2017年10月19日在“ 自然 ” 杂志上发表了一篇文章,介绍了AlphaGo Zero,这个版本不用学习人类的游戏数据,比之前的版本更强大。AlphaGo Zero 在三天内通过自我对弈拥有了超过了AlphaGo Lee的实力,赢得100比0,在21天内达到了AlphaGo Master的水平,并在40天内超过了所有旧版本。它的学习从零开始,且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。
AlphaGo Zero ( 阿尔法元 ) 简介

AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。AI)培养人工智能不从人类专家获得的数据集,对于具有超人技能的AI的发展具有重大意义,因为专家数据通常是昂贵的,不可靠的或不适用于机器的。DeepMind联合创始人兼首席执行官Demis Hassabis表示,AlphaGo Zero功能强大,因为它“不再受人类知识的限制”。
根据Hassabis的说法,AlphaGo的算法可能对于需要通过巨大的可能性空间(如蛋白质折叠或精确模拟化学反应)进行智能搜索的领域最有利。 AlphaGo的技术在难以模拟的领域(例如学习如何驾驶汽车)可能不太有用。
AlphaGo Zero ( 阿尔法元 ) 简介

韩国Go专业人士Lee Sedol说:“之前的AlphaGo版本并不完美,我相信这就是AlphaGo Zero出现的原因。” 对于AlphaGo发展的潜力,Lee表示,他将不得不等待观望,但也表示这将对年轻的Go球员产生影响。指导韩国国家Go队的莫金硕说,Go World已经在模仿AlphaGo之前版本的游戏风格,并从中创造新的想法,他希望AlphaGo Zero能够带来新的想法。莫还补充道,GoGo世界的大趋势现在正在受到AlphaGo游戏风格的影响。莫说:“起初很难理解,我觉得自己好像在和外星人打比赛,但是经验丰富,我已经习惯了。” “我们现在已经超过了我们辩论AlphaGo和人类能力之间差距的地步,现在是在计算机之间。据说莫已经开始和国家队的球员一起分析AlphaGo Zero的打法。“ 虽然只看了几场比赛,中国专业人士,柯杰通过他的微博账号评论了新项目的显著成就:“能纯粹自学AlphaGo是最强的,人类在自我完善面前显得多余”
附:AlphaGo Zero与先前版本的比较(来自*)
AlphaGo Zero ( 阿尔法元 ) 简介

以上