最强写作竟然学会象棋和作曲,语言模型跨界操作引热议,在线求战

十三 鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI

一个搞文本生成的模型,还能用来干嘛?

好奇心很强的网友便拿OpenAI的GPT-2做了个实验。

原来,GPT-2除了能生成文本,竟然还能下象棋、做音乐!

△训练GPT-2下国际象棋

作者表示:

事实证明,只要让 GPT-2预测下一步棋,就可以训练它下国际象棋。

这只是花费了几天的小项目,但结果是相当令人兴奋。

除此之外,在更早的实验中,研究人员还发现GPT-2能作曲。

这也引起了网友们的热烈讨论。

这简直太疯狂了,和玩得较差的人类尚可一搏。

GPT-2学会了下国际象棋,尽管它只是一种文本AI,但是还是能够从象棋符号文本的语料库中学习。

而且它对“棋盘”的概念一无所知。

不过,也有网友对此提出了质疑。

我有一种感觉,它只是在开局的较为配合,从第11步开始就输出无效的“招式”了。

总的来说,这个技术看起来很糟糕,所以很难判断它对国际象棋有什么样的理解。

不过作为一个文本预测模型,在这样的游戏中能做出一些智能的举动,还是令人印象深刻的。

那么,GPT-2下国际象棋、做音乐,到底是怎么一回事呢?

之所以做出这样大胆的尝试,是因为他的胖友格温·布兰文(Gwern Branwen)不仅教会了GPT-2写诗:

美丽的湖,美丽的树林,(Fair is the lake, and bright the wood,)垂满魅惑的花朵:(With many a flower-full glamour hung:)美丽的浅滩,温柔的潮水(Fair are the banks; and soft the flood)我们的舌头发出金色的欢笑。(With golden laughter of our tongue.)

还让GPT-2写出了爱尔兰民歌:

乍一听这个开头,甚至有点像孙燕姿的《遇见》。

所以,能不能通过e2e4(将棋子从e2位置移动到e4位置)这样的国际象棋指令集来训练GPT-2,让这个文本生成模型学会下棋呢?

答案是:可以。

普莱斯发现,仅仅经过一个小时的训练,GPT-2 1.5B模型就表现出了国际象棋“天赋”。

虽然在下了几步棋之后,就会出现无效移动,但这次实验还是证明了,制造GPT-2国际象棋引擎并非不可能。

△第9步出现无效移动

于是,普莱斯又用2.4M数据训练了GPT-2 1.5B模型一整天,模型有所进步:直到第14步,它才出现了bug。

接着,普莱斯“编写了一些代码以计算所有有效移动的概率”(作者并未作出具体解释),GPT-2可以将棋局推至残局了。

普莱斯已经把他的代码部署到了Colab上,如果你想试试这只会下棋的GPT-2棋商如何,可以亲身前往挑战:

去年2月,OpenAI发布了一个“逆天”的语言AI,名为GPT-2。

整个模型包含15亿个参数。

然而,当时假新闻实在编的太真实,所以OpenAI说:我们不敢放出完整模型。

人类只给了它两句话的开头:

科学家们有个令人震惊的发现,在安第斯山脉一个偏远且没被开发过的山谷里,生活着一群独角兽。更加让人讶异的是,这些独角兽说着完美的英文。

AI就顺着这胡言乱语的设定,一本正经地编了下去:

这些生物有着独特的角,科学家们就以此为它们命名,叫Ovid’s Unicorn。长着四只角的银白色生物,在这之前并不为科学界所知。

虽然,这些生物的起源还不清楚,但有些人相信,它们是一个人和一个独角兽相交而诞生的,那时人类文明还不存在。Pérez教授说:“在南美洲,这样的现象很常见。”

效果惊人外,在各种特定领域数据集的语言建模测试中,GPT-2都取得了优异的分数。

它初出茅庐时先放出了124M版本的模型,然后是355M,再然后是774M。

经过9个月断断续续发布,OpenAI最终把15亿参数的完整模型放了出来。

实测结果如何?

OpenAI在博客里说,GPT-2的生成结果,有独立客观第三方的检验,令人信服:

团队在康奈尔大学的合作伙伴,对人类做了问卷调查,给GPT-2输出的文本打出可信分 (Credibility Score) ,各种大小的模型都参与了。

满分10分,大家给15亿参数模型的可信分是6.91。比7.74亿参数的模型 (6.72分) 和 3.55亿参数的模型 (6.07分) 都要高。

超会编故事的NLP模型,现在还能写曲子、下象棋了,这件事引发了网友的热议,甚至吸引来了马库斯。

英国作家Tom Chivers认为,这或许将打开通向AGI(通用人工智能)的新思路。

有网友质疑说,这并不是对下棋这件事的“学习”,只是在统计学上将给定的开局动作与其相应的后续动作关联起来。GPT-2仅仅是给出了符合已知模式的结果。

一位斯坦福CS博士则直言,可能使用非常古早的语言建模方法同样能实现这一结果。说GPT-2“学会下棋”是一种误导。

那么,你怎么看呢?

△Shawn Presser

Shawn Presser,具有丰富的C++游戏引擎编程经验,是一位图形学编程人员、工具开发者。

2005年至2008年,就职于Simutronics,主要从事基于C++的项目开发工作。

THE END
0.国际象棋夺冠,AI竞争再升级|财经大事件#国际象棋#AI#OPENAI国际象棋夺冠,AI竞争再升级 | 财经大事件 #国际象棋#AI#OPENAI投资者网 上海 0 打开网易新闻 体验效果更佳女土结婚彩礼二十八万八,婚礼当天要一半八羊下车礼,岩老师出击 搞笑成哥 1跟贴 打开APP 印国防参谋长称:1962年的惨痛教训不再有 一叶禅林 打开APP 道士太神通广大竟要被当街斩首 倾听看影视 434跟贴 打开APP jvzquC41o07757hqo1|0xrigq1\N899OJQ
1.把国际象棋设计进关卡?论脑洞大开的《晶核》魔棋战局就我个人而言,小时候还时不时玩两把国际象棋和AI对战,但后来娱乐方式主要依靠手机以后,已经很少享受这种对弈的乐趣了,让我万万没有想到的是:我下一次看见国际象棋,居然是在一个动作手游《晶核》之中。 在朝夕光年推出的最新魔导朋克题材动作手游《晶核》中,“最强AI”就布下了一场由紧张刺激的BOSS战构成的魔棋战局——特色各异jvzquC41pg}t0|npc0ipo7hp1u~04975/2<.594fgvgjn6no{|ggkv623;7947xjvor
2.种族主义国际象棋数据集大猩猩博主油管AI“YouTube AI算法因种族主义而将 'Black' 和 'White'混淆,从而封禁了一个国际象棋频道。” (虽然没有明说,但大意是将黑棋和白棋混淆成黑人和白人。) 原来是在几个月前,一位在国际象棋视频圈内很出名的YouTube博主Agadmator,表示他的YouTube频道被官方封禁,是因为他的视频中包含来该网站所谓的“有害和危险”jvzquC41yy}/ew2jgcrujlftg0ipo8ftvkimg€r142822;761euovnsv/37:4=880jznn
3.象棋软件最强手机版免费下载象棋AI对战软件下载随着科技的发展,人工智能(AI)的概念正在走进千家万户中。当然,象棋也不例外,很多象棋游戏软件中都引入了AI对战模式,一个人闲时也能享受象棋棋力博弈的乐趣,AI对战模式也分难度等级,选择适合自己的AI难度对手,还是可以尝试一较高低的。本站专jvzquC41yy}/5;w0eqs0|}4zstp{s8
4.信AI排行榜,不如信它们的游戏排位分数。相比那些传统排行榜,国际象棋考验的是一套无法靠刷题速成的综合能力,更能展示出一个大模型的思考、涌现能力。 过去,我们要想知道哪个模型牛,主要看两种榜。 第一种就是 AI 竞技场 LMArena,可以把它理解为大模型圈的《蒙面歌王》。 你随便问个问题,它给你两个匿名模型的回答,你觉得哪个好就投哪个。 jvzq<84yyy4{ctjt0pku1wjyu1gsvrhngatfy7ujrAvl??=c2chg7Aj;h2?52k<46cigd
5.AI“应用商店”来了!OpenAI首批70个ChatGPTPlugin最全梳理“开始一场大师级别的AI国际象棋比赛。” “我们来下盘棋吧,我从西西里防御C5开始。” “下盘棋,你先开始。” Web Pilot 功能:根据一个或多个URL, 浏览网页内容并生成摘要、总结、翻译等内容。 基本提示:“根据该URL生成文章摘要。” 高级提示: “生成该URL上文章的详细摘要。” jvzquC41ycrmu}wggvio0lto1cxuklqgu197:A<7;
6.DeepMind推出AlphaZeroAI:国际象棋/围棋/将棋通杀|将棋|国际象棋|围棋AlphaZero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台。在三款棋类比赛中,AlphaZero 将三款 AI 都挑落下马。 ● Stockfish:国际象棋 AI 世界冠军; ● elmo:2017 年度世界计算机将棋锦标赛冠军; ● AlphaGo Zero:DeepMind 自家的围棋 AI,被誉为史上最强选手。 jvzquC41vgii0|npc0ipo7hp1tumn8723:32465:1fud/rmowv{fe@5963870|mvon