Facebook首次开源超级围棋AI 复现AI高手AlphaZero
最近,Facebook的人工智能研究所(以下简称FAIR)宣布,他们开源了自研的围棋AI训练模型和代码。这意味着,你可以随时随地和Facebook的人工智能下围棋了,而且此围棋AI程序重现的是名噪一时的AI高手AlphaZero。
去年5月,FAIR发布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上发表的和AlphaGo Zero以及AlphaZero相关的论文,做出的开源计算机围棋程序,也就是说,ELF OpenGo不使用人类棋谱与累积的围棋知识,仅使用单一类神经网络从自我对弈中学习。
该围棋AI之前在和韩国棋院的专业围棋选手对弈中,都取得不错的成绩。据悉,OpenGo 的最新版本使用2000块GPU训练了15天后,在一块GPU的情况下与4个排名前30的职业选手进行比赛时,取得了20:0全胜的战绩,可谓是战无不胜。
在这次开源的论文中,FAIR研究人员全面披露了ELF OpenGo的训练过程,包括取得的是三个突破。
一是为ELF OpenGo训练了一个超人类棋艺的模型,他们在2000个GPU上运行类AlphaZero的训练软件9天后,有20个模块的模型超越了人类水平。
二是提供了模型在训练过程中的行为分析,包括和其他模型的对比、学习速度、学习难度等等。
三是通过实施ablation实验,以研究AlphaZero风格算法的性质,他们发现对于最终模型而言,对局中加倍rollout水平大约提升200 ELO,AI的发挥会受到模型容量的限制。
最后,此次论文的主要作者为田渊栋,他一直负责Facebook的围棋AI相关研究,在此前的一篇知乎文章中,他提到:DeepMind不开源也不透露细节,文章里面一些地方也没有写得很清楚。没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。而且如果我们去看 ELF OpenGo 的代码,会发现其完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。

图片新闻
最新活动更多
-
6月13日立即参评>> 【评选】维科杯·OFweek2025中国工业自动化及数字化行业年度评选
-
6月13日立即参评>> 【评选启动】维科杯·OFweek(第四届)2025汽车行业年度评选
-
6月13日立即参评 >> 【评选启动】维科杯·OFweek 2025(第十届)人工智能行业年度评选
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
-
7月31日免费预约>> OFweek 2025具身机器人动力电池技术应用大会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
- 1 人形机器人革命,NVIDIA如何破局?
- 2 《2025机器人+应用与产业链新一轮加速发展蓝皮书》电子版限免下载!
- 3 用信步工控主板,当行业冠军,“天工”机器人马拉松夺冠!
- 4 【展商推荐】意优科技:专注于人形机器人关节模组的研发与生产
- 5 信步科技发布具身智能开发平台HB03,实现机器人“大、小脑融合”
- 6 MOONLIGHT 玄晖成为全球首款获得 CE+ETL双认证的力控型并联机器人
- 7 MiR 发布最新电子书,揭示AMR 革新医院物流全流程
- 8 谁将成为行业榜样?维科杯·OFweek2025中国工业自动化及数字化行业年度评选邀您参与!
- 9 【展商推荐】因时机器人:专注于微型精密运动部件研发制造和伺服控制技术突破创新
- 10 维科杯·OFweek 2025(第十届)人工智能行业年度评选火热进行中!
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论