最近,facebook的人工智能研究所(以下简称fair)宣布,他们开源了自研的围棋ai训练模型和代码。这意味着,你可以随时随地和facebook的人工智能下围棋了,而且此围棋ai程序重现的是名噪一时的ai高手alphazero。
去年5月,fair发布了elf open go,elf opengo是fair依照deepmind在《自然》上发表的和alphago zero以及alphazero相关的论文,做出的开源计算机围棋程序,也就是说,elf opengo不使用人类棋谱与累积的围棋知识,仅使用单一类神经网络从自我对弈中学习。
该围棋ai之前在和韩国棋院的专业围棋选手对弈中,都取得不错的成绩。据悉,opengo 的最新版本使用2000块gpu训练了15天后,在一块gpu的情况下与4个排名前30的职业选手进行比赛时,取得了20:0全胜的战绩,可谓是战无不胜。
在这次开源的论文中,fair研究人员全面披露了elf opengo的训练过程,包括取得的是三个突破。
一是为elf opengo训练了一个超人类棋艺的模型,他们在2000个gpu上运行类alphazero的训练软件9天后,有20个模块的模型超越了人类水平。
二是提供了模型在训练过程中的行为分析,包括和其他模型的对比、学习速度、学习难度等等。
三是通过实施ablation实验,以研究alphazero风格算法的性质,他们发现对于最终模型而言,对局中加倍rollout水平大约提升200 elo,ai的发挥会受到模型容量的限制。
最后,此次论文的主要作者为田渊栋,他一直负责facebook的围棋ai相关研究,在此前的一篇知乎文章中,他提到:deepmind不开源也不透露细节,文章里面一些地方也没有写得很清楚。没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。而且如果我们去看 elf opengo 的代码,会发现其完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。
转载:中国机器人网(原始来源:评论:0)
以上是网络信息转载,信息真实性自行斟酌。










