分享好友 厨具导购网站首页 频道列表
“阿尔法狗”再进化:“自学”3天高分赢过旧版
2024-06-18 16:24    8818    中华厨具网

北京时间10月19日早间消息,谷歌旗下人工智能研究部门deepmind发布了新版alphago(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为alphago zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。

经过3天的训练后,这套系统已经可以击败alphago lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得alphago zero得以击败alphago master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。alphago master使用了很多与alphago zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。

值得注意的是,虽然alphago zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,alphago zero也比前几代系统更加节能,alphago lee需要使用几台机器和48个谷歌tpu机器学习加速芯片。其上一代alphago fan则要用到176个gpu芯片。alphago zero只需要使用一台配有4个tpu的机器即可。

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网