分享好友 厨具导购网站首页 频道列表
怎样开发“逢赌必赢”的德州扑克机器人?
2024-06-14 19:25    9976    中华厨具网

每年夏天,世界上最好的扑克机器人都会聚到一起——其实是开发它们的计算机科学研究人员聚到一起——举办一个扑克锦标赛。近年来,有三个机器人团队显露了比较明显的优势:第一个是阿尔伯塔大学的团队,目前有大约十几人在开发扑克程序。接下来是卡内基梅隆大学的团队,他们的扑克机器人名为 “tartanian”。然后是独立研究者埃里克·杰克逊(eric jackson),他开发了一个名为“slumbot”的程序。

锦标赛采用的规则分好几种,各个团队会根据规则不同对机器人的“个性”进行调整。有些比赛采用淘汰制,每一轮都有两个机器人互相对抗,到结束时,筹码最少的机器人会被淘汰。为了赢得这种比赛,机器人需要有强大的求生本能。它们的得分只要能顺利进入下一轮就足够了——太贪心不是好事。然而,在另外一些比赛中,总分最多的机器人才能获胜。在这些比赛中,机器人就需要尽可能地每场多赢一些,因此它们需要有更强的进攻性才行。

大多数参加锦标赛的机器人已经开发了好多年,经过成百上千万次,乃至数十亿次的扑克训练。然而,锦标赛的奖金并不多。获胜的研究人员可能会觉得很自豪,赚到了吹牛的资本,但他们获得的奖金数目和拉斯维加斯没法比。那么,这其中的诱惑又是什么呢?

扑克与象棋的不同之处

每当一台计算机玩扑克的时候,它面对的是一个我们大家都很熟悉的问题:如何处理缺少的信息。

在一些游戏中,比如下象棋的时候,信息不是一个问题。玩家可以看到的一切。他们知道哪个棋子在哪里,对手是怎么走棋的。这种游戏的关键不在于玩家无法观察到事情,而在于他们无法处理所有可用的信息。这就是为什么一只猴子随便下的棋有可能(尽管可能性很渺茫)打败象棋大师的原因。

有了良好的玩游戏算法——以及强大的计算能力——信息处理问题是可能破解的。所以阿尔伯塔大学计算机科学家乔纳森·谢弗(jonathan schaeffer)和同事们开发了完美的跳棋策略,形成了计算机如何破解国际象棋的一些理论。机器可以计算所有不同的棋子走法,用纯粹的蛮力法击败对手是有可能的。但扑克就不一样了。无论扑克玩家的牌技都多精湛,都必须面对这样一个事实:你看不到对方的牌。虽然扑克游戏也有规则和限制,但总是存在着一些未知因素。

在生活中,很多问题也有同样的特点。比如谈判、拍卖、议价——都是不完全的信息博弈。 “扑克是一个完美的缩影,可以代表我们在现实世界中遇到的很多种状况。”谢弗说。

“仙王座”驾到

2015年,阿尔伯塔的研究人员在《科学》杂志上发表了一篇关于“仙王座”(cepheus)扑克程序的文章,标题是《双人限注德州扑克被攻破》(h eads-up limit hold’em poker is solved)。

在进行了大量的训练后,仙王座可以成为扑克高手。为了积累经验,它一直不断地玩扑克,大约每秒种两千局。随着时间的推移,它越来越善于探索可能的组合,这意味着在它的出牌策略中,对手可以攻击的薄弱环节越来越少。最终,这个机器人学会了(从长远来看)如何避免失败,哪怕它面对的是一个无懈可击的玩家。研究人员用“遗憾最小化”算法来对仙王座加以完善:每场比赛之后,它会进行回顾,考虑如果用另外的方式出牌,可能会出现怎样的情况,然后再利用这些信息,从错误中学习技能。

仙王座已经表明,即使在复杂的情况下,它也可以找到一个最优化的策略。研究人员指出,在一系列其他场景,比如设计守卫巡逻路线,研发医药疗法等等中,这种算法可能也会相当有用。

当然,这项研究还有一个不那么实用的原因。该团队在这篇科技论文的末尾引用了阿兰·图灵的一句话,大意是说,我们做这项工作的主要动机是因为它充满了乐趣。

人类处在劣势了吗?

电脑程序在象棋、跳棋、扑克游戏中表现不凡,你可能会觉得,人类在这样的比赛不再具有竞争力了。图灵曾指出,如果一个人试图假装自己是一台机器,“他就会表现得很糟糕。”让一个人来做计算,他的速度会比计算机慢得多,而且还更容易算错。

即便如此,这个世界上仍然存在着一些令机器人发懵的情况。在玩智力游戏《危险边缘》(jeopardy!)的时候,ibm机器人“沃森”对长度较短的线索最感头痛。如果主持人说出一个类别和一个名称,比如“第一夫人”和罗纳德·里根 —— 沃森需要很长时间才能在其数据库搜索找到正确的回应(“谁是南希·里根?”)在这个节目中,如果主持人给出的线索较长,也比较复杂,沃森就可以击败人类选手,但是如果线索只有几个词,人类就会占上风。在问答节目中,“简洁”似乎是机器人的天敌。

扑克游戏也是如此。机器人需要时间来研究对手的出牌方式,然后加以利用。而职业扑克玩家可以更迅速地摸清其他玩家的手法。 “人类善于利用很少的数据来做出有关对手的假设,”谢弗说。

阿尔伯塔大学的扑克团队也发现,人类特别容易受到强硬战术的影响。 “一般来说,人类扑克高手在击败对手的策略方面,虚张声势是很重要的一条,” 阿尔伯塔大学的计算机科学研究员迈克尔·约翰森说。 “虚张声势策略给对手施加了很大的压力,让他们做出艰难的决定,因此往往非常有效。”在和人类玩家玩牌时,机器人也试图模仿这种行为,引发对手的错误。

也就是说,机器人似乎可以通过模仿人类的行为来获得很多优势。有时候,就连模仿人类的缺陷也会带来好处。

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

免责声明:

本站所有页面所展现的企业/商品/服务内容、商标、费用、流程、详情等信息内容均由免费注册用户自行发布或由企业经营者自行提供,可能存在所发布的信息并未获得企业所有人授权、或信息不准确、不完整的情况;本网站仅为免费注册用户提供信息发布渠道,虽严格审核把关,但无法完全排除差错或疏漏,因此,本网站不对其发布信息的真实性、准确性和合法性负责。 本网站郑重声明:对网站展现内容(信息的真实性、准确性、合法性)不承担任何法律责任。

温馨提醒:中华厨具网提醒您部分企业可能不开放加盟/投资开店,请您在加盟/投资前直接与该企业核实、确认,并以企业最终确认的为准。对于您从本网站或本网站的任何有关服务所获得的资讯、内容或广告,以及您接受或信赖任何信息所产生之风险,本网站不承担任何责任,您应自行审核风险并谨防受骗。

中华厨具网对任何使用或提供本网站信息的商业活动及其风险不承担任何责任。

中华厨具网存在海量企业及店铺入驻,本网站虽严格审核把关,但无法完全排除差错或疏漏。如您发现页面有任何违法/侵权、错误信息或任何其他问题,请立即向中华厨具网举报并提供有效线索,我们将根据提供举报证据的材料及时处理或移除侵权或违法信息。