Facebook首次开源超级围棋AI 复现AI高手AlphaZero

2019-02-15 14:12

最近，Facebook的人工智能研究所（以下简称FAIR）宣布，他们开源了自研的围棋AI训练模型和代码。这意味着，你可以随时随地和Facebook的人工智能下围棋了，而且此围棋AI程序重现的是名噪一时的AI高手AlphaZero。

去年5月，FAIR发布了ELF Open GO，ELF OpenGo是FAIR依照DeepMind在《自然》上发表的和AlphaGo Zero以及AlphaZero相关的论文，做出的开源计算机围棋程序，也就是说，ELF OpenGo不使用人类棋谱与累积的围棋知识，仅使用单一类神经网络从自我对弈中学习。

该围棋AI之前在和韩国棋院的专业围棋选手对弈中，都取得不错的成绩。据悉，OpenGo 的最新版本使用2000块GPU训练了15天后，在一块GPU的情况下与4个排名前30的职业选手进行比赛时，取得了20:0全胜的战绩，可谓是战无不胜。

在这次开源的论文中，FAIR研究人员全面披露了ELF OpenGo的训练过程，包括取得的是三个突破。

一是为ELF OpenGo训练了一个超人类棋艺的模型，他们在2000个GPU上运行类AlphaZero的训练软件9天后，有20个模块的模型超越了人类水平。

二是提供了模型在训练过程中的行为分析，包括和其他模型的对比、学习速度、学习难度等等。

三是通过实施ablation实验，以研究AlphaZero风格算法的性质，他们发现对于最终模型而言，对局中加倍rollout水平大约提升200 ELO，AI的发挥会受到模型容量的限制。

最后，此次论文的主要作者为田渊栋，他一直负责Facebook的围棋AI相关研究，在此前的一篇知乎文章中，他提到：DeepMind不开源也不透露细节，文章里面一些地方也没有写得很清楚。没有第一手经验总不是很踏实。所以本着研究目的，我们需要复现一下，先有复现，才有创新，这个是做研究的习惯。而且如果我们去看 ELF OpenGo 的代码，会发现其完全适用于其它方向的工作。而围棋对我们来说，只是一个把算法和平台做好的手段。在这一点上，花点时间把围棋做好是值得的。