分享好友 厨具导购网站首页 频道列表
经过一年的修炼,alphago的哪些能力突飞猛进了?
2025-07-30 09:04    3594    中华厨具网

乌镇围棋峰会第一局已经结束了,历时4个半小时,以柯洁九段执黑负于 alphago,alphago 赢四分之一子告终,这样风平浪静的结果想必很多人都预测到了,不过大家从一开始就知道关注的重点,不在于柯洁怎么输的,而是alphago已经进化到什么程度了,距离deep mind团队出论文来详解alphago有多强还有一段时间,so我们其实可以从现场观战中来看出一些端倪。

棋速

第一局棋下到一半的时候,不少棋友群里的人沸腾了,发现alphago落子速度非常快,每步棋落子速度在30s-40s之间波动,对此围棋业余5段赵老师表示:“(这局棋)像安乐死,不知不觉就输了,(相比去年)机器落子飞快但错误基本没有”。

综合整局,alphago落子表现冷静、果断,而柯洁的落子状况较多变。最终在比赛进行了四个多小时之后,alphago赢四分之一子。

棋风

alphago1.0的时候(去年3月跟李世石对战的时候),它的棋风概括起来就是擅长记住棋谱+增强学习+计算能力,身上还能看到人类棋风的影子,等alphago乔装成master60连胜的时候,许多围棋大师包括聂卫平在内开始评价其棋风“很难揣测master的风格……它永远都没有表情,永远不受情绪影响,永远一个节奏,就是要赢你。”而今天,第一局棋还没结束的时候,搜狗王小川已在知乎上发文剖析alphago2.0 棋风“完全脱离人类经验”——“而alphago2.0脱离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。而alphago2.0会不断制造这样的局面,关键他还是对的。”

不过最后还是柯洁说了算,他在会后的采访中用了一个很好的例子说明了alphago的棋风莫测:(在回顾比赛时也对第54手的断)时,他表示了肯定:“很震惊,这在人类的下法中是不能有的。在断之后,它把自己的脚步实地化,变得更厚,一石二鸟。”。

算法

alphago1.0的时候(去年3月跟李世石对战的时候)使用的算法精髓,根据fb田渊栋看完nature论文的解读,由估值网络评估棋局,策略网络选择落子,快速走子(fast rollout)适当加速,再用蒙特卡罗树搜索把以上这三个部分连起来,形成一个完整的系统。

这一次虽然知乎论坛等活跃地盘已经开始纷纷推测这次的alphago2.0用了什么牛叉的算法,有了硬件的预测失误,真相还是等deep mind后面来亲自公布,目测算法预测这个要根据它的单机版10个gpu+tpu助力预测比较靠谱。

硬件需求降低

根据deepmind员工发表在2016年1月nature期刊的论文,分布式版本(alphago distributed)使用了1202个cpu和176个gpu。

不过这次比赛alphago用的何种硬件配置,deepmind在会后的新闻发布会中表示,这次比赛的alphago是新版本,它改善了新的算法,主要进步是计算量少了十倍,自我对弈更强。hassabis称,在比赛中程序是在一个单一的机器上运作的,这与去年不一样,当时是分布式的。这次有更强大的算法,运作起来更简单也更好,获得的速度更快。另外hassabis表示,计算力可以“在google云中获得,用的是tpu,十个处理单位,少了十倍的计算量”。简单点说,这次的alphago是单机版。

迭代速度

哈萨比在此链接中的剑桥大学的一次演讲中提到,以前从零训练一个alphago要三个月,现在只需要一个星期(“we also optimized the performance. it used to take 3 month to train a new version of alphago from scratch. now we can do it in one week.”)。

如果称对战李世石期间的版本为v18迭代版本,乔装成master60连胜并宣布升级完成的时刻为v25版本,现在的alphago又是v多少版本,训练的时候会不会一周都不要了?这是我们明天要亲自问deepmind团队的。

从单人对战到团队对战

心细的朋友肯定注意到了,柯洁和alphago对弈之外,5月26号上午还有一场配对赛,配对赛双方---古力+alphagov连笑+alphago,即对弈双方分别由一位棋手与alphago组成,棋手与alphago合作进行比赛。5月26号上午下午则是陈耀华,周睿羊,芈昱延,时越,唐韦星和alphago的5对1团队赛。

google之所以敢这样设置赛制,唯一的解释就是,alphago现在既懂人类下围棋的那部分,又懂ai下围棋的那部分,并可以做到融会贯通,所以它才敢挑战配对赛这种跟另一个同伴高度配合的赛制,又敢挑战测试自己“战斗力”极限的团体赛。ai最可怕的部分不是它单个力量有多强,而是它开始懂得和周遭“互动”,这样的融汇是不是比去年3月的人机大战可怕多了呢?

小结:

上次alphago乔装成master测试的时候,柯洁已经落败给master过一次,他不是没见识过ai围棋的厉害,但结合柯洁今天在现场的冷静表现,和他昨晚莫名其妙地深夜感慨,我们有理由相信,这不是一场比ai围棋选手和人类围棋选手哪个更厉害的选手,deepmind团队一定有些悬而未决的答案需要这场比赛给一个肯定的验证,然后再往那个方向实现更深一步的探索。

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

免责声明:

本站所有页面所展现的企业/商品/服务内容、商标、费用、流程、详情等信息内容均由免费注册用户自行发布或由企业经营者自行提供,可能存在所发布的信息并未获得企业所有人授权、或信息不准确、不完整的情况;本网站仅为免费注册用户提供信息发布渠道,虽严格审核把关,但无法完全排除差错或疏漏,因此,本网站不对其发布信息的真实性、准确性和合法性负责。 本网站郑重声明:对网站展现内容(信息的真实性、准确性、合法性)不承担任何法律责任。

温馨提醒:中华厨具网提醒您部分企业可能不开放加盟/投资开店,请您在加盟/投资前直接与该企业核实、确认,并以企业最终确认的为准。对于您从本网站或本网站的任何有关服务所获得的资讯、内容或广告,以及您接受或信赖任何信息所产生之风险,本网站不承担任何责任,您应自行审核风险并谨防受骗。

中华厨具网对任何使用或提供本网站信息的商业活动及其风险不承担任何责任。

中华厨具网存在海量企业及店铺入驻,本网站虽严格审核把关,但无法完全排除差错或疏漏。如您发现页面有任何违法/侵权、错误信息或任何其他问题,请立即向中华厨具网举报并提供有效线索,我们将根据提供举报证据的材料及时处理或移除侵权或违法信息。