论坛

 找回密码
 注册
                  
查看: 1685|回复: 0

首届人类vs.电脑扑克牌大赛 Polaris程式落败

[复制链接]
发表于 2007-8-16 08:59 | 显示全部楼层 |阅读模式
2007-08-06

在加拿大温哥华先进人工智慧促进协会(the Association for the Advancement of Artificial Intelligence,AAAI)会议上举行的全球首届人机扑克锦标赛(The World's First Man-Machine Poker Championship),两位扑克牌大师与名为Polaris的电脑程式大战,最后人类击败了电脑。

在这场竞赛中,曾是世界巡回扑克赛(World Poker Tour)冠军、外号「The Unabomber」的机械工程师Phil Laak,以及游戏顾问Ali Eslami化身专业扑克牌手,在最后两盘比赛中击败Polaris,而Polaris在开始的两盘比赛中一胜一平。尽管最后败阵,但编写Polaris 程式的加拿大Alberta大学团队仍对结果感到满意。

「能在四盘比赛中获得一胜一平,我们已经非常开心,这对我们来说是大幅进步的一个里程碑,」领到Alberta大学团队的教授Jonathan Schaeffer表示:「在最后两个回合中,人类选手全力以赴投入比赛,能获得胜利理所当然。」

这场竞赛是由扑克学院(Poker Academy)监督,的较量包含四盘500手(500-hand)的比赛,共有2000手扑克,由随机选择的几副牌中透过电子方式发牌。有两台具备相同 Polaris程式的电脑同时在单独房间内隔离的两位扑克手进行比赛,每盘比赛结束时两位选手共享奖金。而获得胜利的Laak和Eslami总共赢到5万美元的奖金。

不同於国际西洋棋比赛使用计时器来避免人类比电脑思考的时间长,这场扑克牌比赛允许人类选手根据他们的需要进行思考。因此,选手们不会像西洋棋手Gary Kasparov与IBM的Deep Blue电脑比赛时那样犯明显的错误,许多专家认为正是这个错误导致十年前Kasparov输给Deep Blue。

「如果有时间限制的话,我们可能不会赢。」Laak在赛后表示。在第三盘比赛中,Polaris输给了人类选手,而在比赛结束之后也在其程式中抓到了一个错误(bug);因此有激动的部落客指出,如果不是这样的话人类选手可能会输。不过Schaeffer并不同意以上说法。

「这个错误意味着Polaris未能按它应有的能力去比赛──在第三盘中所用的Polaris版本是一个学习程式(learning program),而这个错误意味着在比赛期间收集的一些资料并未被该程式所掌握。人类选手本应获得胜利,与这个错误无关。」Schaeffer表示。

Polaris程式是数位大学教授、工程师与研究所学生的合作成果,由多种演算法所组成,并已事先透过一个庞大的资料库进行比赛演练。在比赛期间,Polaris程式是由一台Apple MacBook Pro所执行,藉由电脑预先运算的结果来决定如何出牌。而具备学习模式的Polaris版本是在比赛的第三回合使用,包含了一些重要的即时(real-time)程式码。

对工程师来说,打扑克牌可能听起来并不难,而且以产业标准来说,此一程式设计案规模也不算大,仅包含两万行左右的程式码。不过 Polaris的关键并非在实际的软体,而是其基础概念。「在西洋棋界,当Deep Blue在速度更快的硬体上执行,就会变成更可怕的对手,不过Polaris的模式并不一样,其关键在於所运用的演算法。」Schaeffer解释。

研究小组计划根据比赛期间的性能合力改善Polaris程式,此外Schaeffer也期望新进的研究生能在明年的比赛来临之前提出一些新点子。「对於我们团队而言,这是令人筋疲力尽的体验,」Schaeffer表示:「但是赛后我们的团队心情振奋,也期待能用改良的Polaris版本参加明年的竞赛。」
您需要登录后才可以回帖 登录 | 注册

本版积分规则



小黑屋|手机版|Archiver|论坛

GMT+8, 2024-12-28 08:12 , Processed in 0.058197 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表