人机对战简史:从国际象棋到德州扑克

这是继AlphaGo在围棋领域大杀四方之后,AI对人类新的挑战。本文将为您梳理,在过去二十年的历史中,人机对战经历了哪些关键节点,AI又发生了怎样的进化?

关键词:计算力

1996年2月,美国费城,一场在当时被称作“世纪大战”的较量。

国际象棋世界棋王卡斯帕罗夫面对的挑战者,并不是人。

卡斯帕罗夫的对手是IBM的超级国际象棋电脑“深蓝”,为了这次较量,后者早已做足了准备。

在国际象棋每一个回合中,一个玩家可以有大约35种不同的行棋选择,这些选择推导结果是单线程的,从A到B到C的推导选择。随机不可控因素更小,也不存在局部的输赢影响整体战局的关系。对局双方的决策能够更直接地控制整个局面的走势。

也就是说,国际象棋的比赛,很大程度上是棋手计算力的较量。

为了能比对手——世界棋王卡斯帕罗夫——多算准一步,深蓝中,用C语言输入了一百多年来优秀棋手的两百多万场对局。这台电脑重1270公斤,有32个节点,每个节点有8块专门为进行国际象棋对弈设计的处理器,运行速度达一亿次每秒。

然而在1996年的这场6局比赛中,深蓝最终以2:4落败。

首次挑战失败后的一年里,IBM的工程师们将“深蓝”的运算速度又提高了一倍,达到两亿次每秒。但深蓝并非计算机的王者。事实上。深蓝的运算能力当时在全球超级计算机中居第259位。即便这样,深蓝仍然可以算出所有路数来选择最佳策略:新的深蓝靠硬算可以预判12步,而卡斯帕罗夫只能预判10步。

1997年5月,深蓝再次挑战棋王卡斯帕罗夫。在前五局2.5对2.5打平的情况下,棋王第六盘决胜局中仅仅走了19步,就败给了深蓝。最终深蓝电脑以3.5:2.5(1胜2负3平)获胜,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。

比赛结束后,“深蓝”小组公布了一个秘密,每场对局结束后,小组都会根据卡斯帕罗夫的情况相应地修改特定的参数,“深蓝”虽不会思考,但这些工作实际上起到了强迫它“学习”的作用,这也是卡斯帕罗夫始终无法找到一个对付“深蓝”的有效办法的主要原因。

关键词:自然语言理解,数据库,计算力

2011年IBM的超级计算机Watson,宣布参加美国综合挑战节目《危险边缘》。这档电视问答节目自1964年开播,游戏里的问题包罗万象,几乎涵盖了人类文明的所有领域。

人类选手詹宁斯和鲁特都是这个领域的顶级高手。前者曾创下连续74场赢得比赛的纪录,后者在比赛中共拿到325万美元奖金,但仍然不是Watson的对手。比赛进行到第三天,Watson以41413美元的分数锁定胜局,而两位人类选手分别仅获得19200美元和11200美元。

Watson的胜利背后,是一个挑战和两个优势。

Watson面临的首要问题就是自然语言理解。能否与主持人互动,理解主持人自然语言的语义和语气,甚至区分问题里的双关,隐喻等信息,是Watson能够做出回答的前提。

突破了这一关之后,Watson就如鱼得水了。首先,它拥有一个强大的信息来源。其中包括百科全书、字典、词典、新闻和文学作品,还包括数据库、分类学和本体论。虽然在比赛中没有连接互联网,4TB的磁盘上仍有2亿页结构化和非结构化的信息供其使用。

其次,它还有强大的计算能力。

Watson基于16TB内存、2880个Power7系列处理器——当前架构中最强的处理器。这就意味着Watson的快。第一是检索快,它能够在3秒内检索数百万条信息,并选择三个可能性最高的答案;第二是判断快,它能够迅速结合场上情况做出抢答与否的决策;第三是抢答快,当其中一个答案的可能性超过50%后,立即启动抢答。它超越人类的抢答速度主导了整场比赛。

关键词:深度学习,神经网络

围棋曾经是人工智能遥不可及的战场。

国际象棋中,平均每回合有35种可能,一盘棋可以有80回合,而围棋每回合有250种可能,一盘棋可以长达150回合。同时,一场围棋比赛中出现的不同局面多达3的361次方种。

此外,围棋博弈是多个局部战争合成的最终结果,同时局部之间相互影响,无法被算法穷举。更专业点说,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆。

谷歌的AlphaGo程序突破了传统电脑的“固定”程序逻辑,融入了深度学习和神经网络的能力。这个深度神经网络由策略网络和值网络两部分组成,策略网络负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的。这样AI就可以重点分析那些有戏的棋着。值网络负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。

AlphaGo利用这两个工具学习了人类所有的棋谱,经过了几千万次的自我对弈与学习,不仅能够模仿人类棋手的思考,甚至已能够超越。2016年3月,在与AlphaGo对决的人机大战中,来自韩国的世界围棋冠军李世石以1:4告负。

除了计算能力外,这场比赛还暴露出机器的其他优势:赛场上,人会因为比赛环境和压力等外部或情绪因素影响判断,而机器不会;在数小时的鏖战中,人会因疲倦而分神,机器却能永远保持专注。赛场外,人每天可做的练习是有限的,AI则能以上万倍于人类的速度练习。

李世石在比赛后接受采访时说道:“要适应与AlphaGo的比赛,首个挑战就是心理方面,需要非常专注。我继续和它下不一定能赢,因为无法比它更专注,这些方面是赢不了它的。”

2017年3月,AlphaGo的升级版Master横空出世,通过下快棋连胜职业高手60盘,其中就包括了中国最强棋手柯洁。

AlphaGo2.0发布于2017年年初,相比于1.0,这个版本能称得上真正的“自我学习”。1.0版本的AlphaGo以人类所有棋谱为蓝本,AlphaGo再怎么走也只是算出了人类棋手曾走过的某一步,顶多算是个完美的“人类棋手”。而2.0版本AlphaGo就利用这个“完美棋手”的估值函数自我对局和“深度学习”,超出了人类棋谱的范围,是真正机器算出来的棋法。

2017年4月,AlphaGo还将有一场与柯洁的人机对战,这或许将会是人机在围棋领域的最后一战。

关键词:不完美信息的博弈

围棋、国际象棋比赛中双方所有信息一览无余,本质上是对称信息的博弈,而德州扑克是信息不对称的博弈,每个选手只能看到自己的手牌。这就决定了人工智能首先需要面对大量不完整的信息。

因此,德扑背后是一个大型的AI谈判算法。“冷扑大师”并不基于大数据、深度学习、强搜索等传统AI方法;而是基于博弈论,直接在比赛同时动态优化胜率最高的数学模型。这其中不仅包含了概率统计和运筹策略,也包含了巨大的信息处理计算量。CMU计算机学院院长Andrew Moore在接受采访时说道:“冷扑大师的程序如果要让人类去计算,大概得花人类1000万个小时。”

与此同时,冷扑大师也面临着挑战。德州扑克更接近人性,因为信息是有隐藏的,牌手可以诚实地表达,也可以欺骗地表达,即德州扑克中的诈唬(bluff)技术。而机器明显无法通过对手的动作表情判断对手牌的强弱,也无法通过肢体、神态表演来蒙蔽对手。

百度首席科学家吴恩达(Andrew Ng)就曾指出,“扑克(不完美信息博弈)是人工智能最难攻克的游戏之一。每一步没有所谓的最优解,人工智能要采取随机的策略,这样它诈唬的时候对方才会吃不准。”

相比围棋AI,德州扑克AI应用空间更广泛。现实世界中,不完美信息博弈才是常态,例如在商业谈判、医疗方案制定等领域,这些过去被认为人类拥有独特优势的领域,未来都会面临机器的挑战。

结语:

从1996年到2017年,人工智能与人类的四次竞赛从侧面反映出了AI的进化:从计算能力超越人类到学会自然语言理解,再到深度学习直至掌握不完美信息博弈的能力。在这21年中,机器不仅智商越来越高,在情商上也越来越不输于人类。尤其是当AI在其最难攻克的游戏德州扑克上与人类叫板,这意味着什么,又将带来哪些机会和挑战?

4月10日上午10点到12点,极客公园将携手创新工场,和德州扑克AI“冷扑大师”背后的主创团队卡内基梅隆大学计算机系教授Tuomas Sandholm,创新工场董事长李开复博士及五位国内科技公司创始人一起探讨“冷扑大师”背后的技术逻辑以及AI会在未来产生哪些更深层次的影响。

THE END
0.国际象棋比赛机器人因男孩犯规弄断手指是AI觉醒?纯属误会|机器人|AI|人机互动如何防范机器人的“无意识伤害”(北京青年报) 张田勘 据俄罗斯通讯社塔斯社报道,在上周的莫斯科国际象棋公开赛上,一个国际象棋机器人折断了一名7岁男孩的手指。事发现场的视频显示,机器人在拿走了男孩的一个棋子后,突然扑了上来,似乎是对男孩针对自己上一步落子动作的快速反应“感到不安”。 这则消息再度jvzquC41pg}t0|npc0ipo7hp1q532;7/293398iqe/onkƒruex979<6960yivvq
1.中国象棋人机双人残局,棋艺惊世中国象棋-人机双人残局,棋艺惊世You Might Also Like 宽立象棋 Games 中国象棋-博雅 Games 全民象棋 - 经典中国象棋益智策略游戏 Games Chess Stand-alone version Games 元游中国象棋 Games 多乐中国象棋-大家在玩的多乐象棋 Games 游戏® - 象棋 中国象棋单机版 jvzquC41crvt0jurng4dqv4ty1gqr8*G6'H9'JI'G7+:D.GF'G>&D:*C3'K7'J8':D3&G=*DC'HB'N;';E+CC.J7':L&:L*G6'HB'KF'G8+BG.=D'G;&D:*:2/+F8.F5':H&GA*:;'HB'N;':5+9C.J6'D>&;?4kf3662:;7;5=@unj/cnr>e~xvqoksu6fnuq3cq~ljv/gqr|
2.国际象棋在线人机对弈是什么?揭秘智能棋盘新体验棋栗chessnut Air智能国际象棋电子棋盘联网比赛人机对战教学训练 爆料价¥9??.??优惠前¥1199.0 立即购买 国际象棋在线人机对弈,指的是通过网络连接,与人工智能程序进行实时对战的棋类活动♟️。这种对弈方式打破了传统必须面对面或依赖电脑软件的限制,让爱好者随时随地都能挑战不同等级的AI对手。借助智能硬件与jvzquC41lkgoiqz0vcuccx3eqo5hwjsinqibn899976`6;8e;277goi;f:67;?85;;?32A;:88
3.加里·卡斯帕罗夫:从国际象棋世界冠军到人机协作先锋,探索AI赋能1997年与深蓝的对弈虽然以失败告终,但卡斯帕罗夫从中看到了技术的潜力,并通过“高级国际象棋”展示了人机合作的巨大可能性。他的“卡斯帕罗夫法则”强调了人类与AI系统和谐合作的重要性,这一理念在多个领域都有广泛的应用前景。 此外,卡斯帕罗夫通过其国际象棋基金会,积极推广国际象棋教育,帮助学生培养逻辑思维和问题jvzquC41yy}/hxwyctjqc}myc{4dqv4326637
4.国象再演人机大战克拉姆尼克挑战顶尖对弈程序综合体育新浪体育讯 北京时间11月25日晚,在德国波恩的国家艺术展览馆将上演一场引人注目的国际象棋人机大战。本次人机大战的一方是上个月刚刚加冕世界冠军的俄罗斯特级大师克拉姆尼克,另一方则是世界顶尖的国际象棋对弈程序深弗里茨(Deep Fritz)。 本次比赛由总部位于埃森的德国第三大化工企业,鲁尔集团股份有限公司(RAG公司)赞助jvzquC41urusv|3ukpg/exr0ep5hq8722832367713?1;;::9;>40|mvon
5.c++国际象棋有人机qt5.9.9启动chesss利用C++的知识和QT以及一些自行拓展的新知识,实现国际象棋的开发。 使自己更加深层的理解和掌握c++并在程序中展现出来,同时开发编程的思想和能力,以及扩展知识面,学习一些课上没有涉及的内容。同时通过阅读一定量他人的代码,使自己更加熟练的看懂别人的思想及做法从中学习,提高自己的编程能力。 jvzquC41dnuh0lxfp0tfv8r2a7;43;;6:1gsvrhng1jfvjnnu1746B:::7=
6.盘点棋盘上的“人机大战”:从“深思”到“阿尔法围棋”图为1997年5月11日,棋迷在纽约通过电视观看第二次国际象棋人机大战。当日,卡斯帕罗夫在纽约再次负于IBM超级电脑“深蓝”,从而在当年的“人机大战”中以一胜二负三和的战绩败北。新华社发 图为1997年5月3日卡斯帕罗夫(左)与代替“深蓝”走棋的IBM公司电脑工程师许峰雄对弈。当日,国际象棋世界冠军卡斯帕罗夫以45步jvzquC41vgii0qzcpsov0lto1cxuklqg1;IbM{sLWuyG
7.上课飞无人机骑马打高尔夫?揭秘小学宝藏兴趣课,原来这么有意思国际象棋 “黑白天地把手谈,方圆世界觅从容”,欢迎爱好下棋的孩子加入到这里来。领略围棋作为“国粹”的博大精深。在国际象棋的对弈中,锻炼思维能力,增强同学们交流陶冶情操。 航模 无人机 孩子们心中飞行的理想将在这里启航。动手制作模型,学习飞行无人机,学习到了如何控制飞行器,了解航空原理。激发了学生的想象力和jvzq<84ue0yjpj3eqo4dp8jfw1ydgmz14284/9>/445eg}fknakewh2ko|trctw467>5:>3ujvsm
8.象棋和国际象棋的电脑程序是如何设计的?热血的青春国际象棋打败人类10多年前就已经由深蓝完成了,近年仅是个人电脑的国际象棋软件的等级分就已经大幅度超过人类,已经没有人类的世界冠军笨到跟计算机挑战自取其辱了。原先还经常的举办国际象棋人机对抗赛,但是几年前开始,为了使人机对抗赛更为有悬念,比赛规则已经改变成计算机让F线以外的一兵了——如果对国际象棋有较为jvzquC41yy}/ewgnqiy/exr1jcttqw61r1=1;B>640nuou