最强写作竟然学会象棋和作曲，语言模型跨界操作引热议，在线求战|在线国际象棋ai_国际象棋

十三鱼羊发自凹非寺量子位报道 | 公众号 QbitAI

一个搞文本生成的模型，还能用来干嘛？

好奇心很强的网友便拿OpenAI的GPT-2做了个实验。

原来，GPT-2除了能生成文本，竟然还能下象棋、做音乐！

△训练GPT-2下国际象棋

作者表示：

事实证明，只要让 GPT-2预测下一步棋，就可以训练它下国际象棋。

这只是花费了几天的小项目，但结果是相当令人兴奋。

除此之外，在更早的实验中，研究人员还发现GPT-2能作曲。

这也引起了网友们的热烈讨论。

这简直太疯狂了，和玩得较差的人类尚可一搏。

GPT-2学会了下国际象棋，尽管它只是一种文本AI，但是还是能够从象棋符号文本的语料库中学习。

而且它对“棋盘”的概念一无所知。

不过，也有网友对此提出了质疑。

我有一种感觉，它只是在开局的较为配合，从第11步开始就输出无效的“招式”了。

总的来说，这个技术看起来很糟糕，所以很难判断它对国际象棋有什么样的理解。

不过作为一个文本预测模型，在这样的游戏中能做出一些智能的举动，还是令人印象深刻的。

那么，GPT-2下国际象棋、做音乐，到底是怎么一回事呢？

之所以做出这样大胆的尝试，是因为他的胖友格温·布兰文（Gwern Branwen）不仅教会了GPT-2写诗：

美丽的湖，美丽的树林，(Fair is the lake, and bright the wood,)垂满魅惑的花朵：(With many a flower-full glamour hung:)美丽的浅滩，温柔的潮水（Fair are the banks; and soft the flood）我们的舌头发出金色的欢笑。(With golden laughter of our tongue.)

还让GPT-2写出了爱尔兰民歌：

乍一听这个开头，甚至有点像孙燕姿的《遇见》。

所以，能不能通过e2e4（将棋子从e2位置移动到e4位置）这样的国际象棋指令集来训练GPT-2，让这个文本生成模型学会下棋呢？

答案是：可以。

普莱斯发现，仅仅经过一个小时的训练，GPT-2 1.5B模型就表现出了国际象棋“天赋”。

虽然在下了几步棋之后，就会出现无效移动，但这次实验还是证明了，制造GPT-2国际象棋引擎并非不可能。

△第9步出现无效移动

于是，普莱斯又用2.4M数据训练了GPT-2 1.5B模型一整天，模型有所进步：直到第14步，它才出现了bug。

接着，普莱斯“编写了一些代码以计算所有有效移动的概率”（作者并未作出具体解释），GPT-2可以将棋局推至残局了。

普莱斯已经把他的代码部署到了Colab上，如果你想试试这只会下棋的GPT-2棋商如何，可以亲身前往挑战：

去年2月，OpenAI发布了一个“逆天”的语言AI，名为GPT-2。

整个模型包含15亿个参数。

然而，当时假新闻实在编的太真实，所以OpenAI说：我们不敢放出完整模型。

人类只给了它两句话的开头：

科学家们有个令人震惊的发现，在安第斯山脉一个偏远且没被开发过的山谷里，生活着一群独角兽。更加让人讶异的是，这些独角兽说着完美的英文。

AI就顺着这胡言乱语的设定，一本正经地编了下去：

这些生物有着独特的角，科学家们就以此为它们命名，叫Ovid’s Unicorn。长着四只角的银白色生物，在这之前并不为科学界所知。

虽然，这些生物的起源还不清楚，但有些人相信，它们是一个人和一个独角兽相交而诞生的，那时人类文明还不存在。Pérez教授说：“在南美洲，这样的现象很常见。”

效果惊人外，在各种特定领域数据集的语言建模测试中，GPT-2都取得了优异的分数。

它初出茅庐时先放出了124M版本的模型，然后是355M，再然后是774M。

经过9个月断断续续发布，OpenAI最终把15亿参数的完整模型放了出来。

实测结果如何？

OpenAI在博客里说，GPT-2的生成结果，有独立客观第三方的检验，令人信服：

团队在康奈尔大学的合作伙伴，对人类做了问卷调查，给GPT-2输出的文本打出可信分 (Credibility Score) ，各种大小的模型都参与了。

满分10分，大家给15亿参数模型的可信分是6.91。比7.74亿参数的模型 (6.72分) 和 3.55亿参数的模型 (6.07分) 都要高。

超会编故事的NLP模型，现在还能写曲子、下象棋了，这件事引发了网友的热议，甚至吸引来了马库斯。

英国作家Tom Chivers认为，这或许将打开通向AGI（通用人工智能）的新思路。

有网友质疑说，这并不是对下棋这件事的“学习”，只是在统计学上将给定的开局动作与其相应的后续动作关联起来。GPT-2仅仅是给出了符合已知模式的结果。

一位斯坦福CS博士则直言，可能使用非常古早的语言建模方法同样能实现这一结果。说GPT-2“学会下棋”是一种误导。

那么，你怎么看呢？

△Shawn Presser

Shawn Presser，具有丰富的C++游戏引擎编程经验，是一位图形学编程人员、工具开发者。

2005年至2008年，就职于Simutronics，主要从事基于C++的项目开发工作。

THE END

最强写作竟然学会象棋和作曲，语言模型跨界操作引热议，在线求战

国际象棋大赛竟“出老千”科学家发现作弊新动向

诺贝尔化学奖揭晓！国际象棋大师破解了蛋白质的密码

最强写作竟然学会象棋和作曲，语言模型跨界操作引热议，在线求战

eepind哈萨比斯：或将打败更多诺奖级难题国际象棋卡斯帕罗夫人工智能

传苹果英伟达将投资pen，新一轮估值超千亿美元；烧脑的中秋国庆调休安排，国内外都算不明白，集体大“翻车”！丨周报

火花国际象棋杜春晖：时代国际象棋是素质教育的科学工具教学

征服国际象棋：以前模仿人类，现在自学成才

谁是全球最顶级实验室eepindpen和霸榜前三deepmindopenai人工智能谷歌

国象评估函数（三）tockish评估概览irdy

lphaero炼成最强通用棋类，仅用小时就能完爆人类棋类游戏

你我的运动，正科幻起来——前沿科技激发体育产业新动能

ython开发应用国际象棋应用圆柱模板

奥特曼称

称霸围棋时我保持沉默，因为我是ot玩家…然而现在ot也陷落了

机器人产业观察：款人形机器人亮相，但行业仍需“冷思考”世相

谷歌人工智能围棋程序lphao战胜世界围棋冠军李世石→买购

对人胜率，eepind首次在西洋陆军棋中达到人类专家水平deepmind棋盘游戏人工智能纳什机器人