人类多余?AI想超越人类可没那么容易
今年五月份举行的乌镇围棋峰会上,AlphaGo击败柯洁之后可以说在围棋界里已是“独孤求败”的境界了,几乎无人是其对手。人们在赞赏的同时,也想看到是否会出现一个对手,能够将ALphaGo拉下马。
事实就是这样,越想着什么越会发生什么。ALphaGo终于遇到了自己的对手,这个对手甚至以摧枯拉朽之势击败了ALphaGo。
就在上周,据外媒报道,英国DeepMind团队在《自然》杂志上发表了相关论文,介绍了新一代的围棋AI:ALphaGo Zero。使用了强化学习技术的ALphaGo Zero可以通过自我对弈进行训练,棋力大幅度增长,轻轻松松击败了曾经不可一世的ALphaGo。人们再次被震惊了,就连柯洁都发出了“人类多余”的感叹。
图片源自微博
ALphaGo Zero到底是何方神圣?
可能有的人认为,这没有什么特别的。ALphaGo Zero是ALphaGo的强化版,比ALphaGo经历了更多的数据演练,打败ALphaGo很正常。然而事实并不是这么简单。
在过去,AlphaGo都是使用专业人类棋手的对局数据来进行训练,可以说是人类棋手的指导下,让它一步步的成长起来。而ALphaGo Zero完全不同,它采用了强化学习技术,从随机对局开始,不依靠任何人类专家的对局数据或者人工监管,而是让其通过自我对弈来提升棋艺。
据了解,ALphaGo Zero经过3天的训练,就已经可以击败AlphaGo Lee(去年击败韩国顶尖棋手李世石的系统),比分为100比0。经历40天训练后,它总计运行了大约2900万次自我对弈,又击败AlphaGo Master(今年击败世界冠军柯洁的系统),且比分为89比11。要是说ALphaGo对阵人类只是略胜一筹,那对阵ALphaGoZero简直就是被碾压的局面。
DeepMind团队表示,ALphaGo Zero之所以那么强,原因在于它采取的强化学习技术。他们发现AlphaGo Zero自我对弈仅几十天,就掌握了人类几百年来来研究出来的围棋技术。由于整个对弈过程没有采用人类的数据,因此ALphaGo Zero的棋路独特,不再拘泥于人类现有的围棋理论。
图片新闻
最新活动更多
-
11月22日立即报名>> 【线上&线下同步会议】领英 跃迁向新 年度管理者峰会
-
11月30日立即试用>> 【有奖试用】爱德克IDEC-九大王牌安全产品
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
限时免费下载立即下载 >>> 2024“机器人+”行业应用创新发展蓝皮书
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论