AlphaGo Zero ( 阿尔法元 ) 简介

阿尔法元是Deepmind围棋软件AlphaGo的一个版本。AlphaGo团队于2017年10月19日在“ 自然 ” 杂志上发表了一篇文章，介绍了AlphaGo Zero，这个版本不用学习人类的游戏数据，比之前的版本更强大。AlphaGo Zero 在三天内通过自我对弈拥有了超过了AlphaGo Lee的实力，赢得100比0，在21天内达到了AlphaGo Master的水平，并在40天内超过了所有旧版本。它的学习从零开始，且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。
AlphaGo Zero ( 阿尔法元 ) 简介

AlphaGo Zero仅用到一张神经网络，这张网络经过训练，专门预测程序自身的棋步和棋局的赢家，在每次自我对弈中进步。新程序只使用一台机器和4个TPU。AI）培养人工智能不从人类专家获得的数据集，对于具有超人技能的AI的发展具有重大意义，因为专家数据通常是昂贵的，不可靠的或不适用于机器的。DeepMind联合创始人兼首席执行官Demis Hassabis表示，AlphaGo Zero功能强大，因为它“不再受人类知识的限制”。
根据Hassabis的说法，AlphaGo的算法可能对于需要通过巨大的可能性空间（如蛋白质折叠或精确模拟化学反应）进行智能搜索的领域最有利。 AlphaGo的技术在难以模拟的领域（例如学习如何驾驶汽车）可能不太有用。
AlphaGo Zero ( 阿尔法元 ) 简介

韩国Go专业人士Lee Sedol说：“之前的AlphaGo版本并不完美，我相信这就是AlphaGo Zero出现的原因。” 对于AlphaGo发展的潜力，Lee表示，他将不得不等待观望，但也表示这将对年轻的Go球员产生影响。指导韩国国家Go队的莫金硕说，Go World已经在模仿AlphaGo之前版本的游戏风格，并从中创造新的想法，他希望AlphaGo Zero能够带来新的想法。莫还补充道，GoGo世界的大趋势现在正在受到AlphaGo游戏风格的影响。莫说：“起初很难理解，我觉得自己好像在和外星人打比赛，但是经验丰富，我已经习惯了。” “我们现在已经超过了我们辩论AlphaGo和人类能力之间差距的地步，现在是在计算机之间。据说莫已经开始和国家队的球员一起分析AlphaGo Zero的打法。“ 虽然只看了几场比赛，中国专业人士，柯杰通过他的微博账号评论了新项目的显著成就：“能纯粹自学AlphaGo是最强的，人类在自我完善面前显得多余”
附：AlphaGo Zero与先前版本的比较（来自*）
AlphaGo Zero ( 阿尔法元 ) 简介

以上

AlphaGo Zero ( 阿尔法元 ) 简介

相关推荐