关于围棋的故事和传奇有很多,当人工智能和围棋相结合,平面的方寸棋盘演变为多维视觉,触及的不仅仅是我们身处的世界,还有那浩瀚无边的宇宙。坐隐、手谈、忘忧,谁在执AI之手与人类对弈?五百年来棋一局,谁在棋盘边立成烂柯人?
“现在开始读秒。”
电子钟响起了字正腔圆的女声,周弦正襟危坐,心跳随着倒计时而加剧。他想立马冲到操作中心查看“坐隐”的运行参数,但目光却死死地盯着眼前的屏幕——
三次读秒,每次各三十秒,留给“坐隐”的时间,只剩下一分半钟。
对于围棋人工智能来说,一分半的时间原本足够漫长;然而,在读秒之前,“坐隐”已经在一手棋上花费了一个半小时的时间。
显而易见,“坐隐”发生了异常。
所以,对“坐隐”来说,眼下这一分半的时间,何其短暂。
第一次读秒的时间告罄,进入到第二次读秒。周弦按捺不住心中的焦虑,手伸进棋罐,搅动棋子,发出失礼的哗哗声响。此时此刻,他恨不得自己落子——
眼下,面对“坐隐”的必胜之局,连自己都能越俎代庖地为“坐隐”赢得胜利。
但这并非周弦的对局,而是围棋人工智能之间的较量:第七届世界围棋人工智能大赛,中国智海公司旗下的围棋人工智能“坐隐”和美国微谷公司旗下的围棋人工智能DigitGo在决赛相逢,无论是周弦还是坐在他对面的美国人比尔·格林,都只是为围棋人工智能在真实棋盘上落子的工具而已。事实上,围棋人工智能之间的对弈并不需要真实的棋具,但出于仪式感,人们仍为围棋人工智能设置了宽敞的对局室——
一套古色古香的中式桌椅位于对局室正中,桌面上摆放着价值不菲的榧木棋盘和中國云子。周弦和格林相对而坐,两人身侧各摆着一台浅灰色方桌,方桌上各放置一台二十八寸的显示器,显示人工智能的落子位置。在两人的另一侧还摆着一张长条形的木桌,桌后坐着裁判长奎勒·琼森和记谱员莫尔森·卡宁,他们同样正襟危坐,凝视着前方在一个半小时内都未有动静的棋局。
自世界围棋人工智能大赛开办以来,微谷公司旗下的DigitGo已经拿下了六届冠军,无一败绩。而谁都没有料到,名不见经传的中国围棋人工智能“坐隐”会在第七届赛事中杀入决赛,并在决赛中将DigitGo逼入绝境——在“坐隐”出现故障之前,“坐隐”的黑棋已经将白棋一块三十七子的大棋牢牢围困,仅剩下只此一手的最后一击。
身为“坐隐”研发团队的领导者,周弦在开赛之前就预料到“坐隐”将会在决赛中奠定不可动摇的胜势。和基于人类设计的训练机制进行自我对弈的围棋人工智能有所不同的是,“坐隐”并不遵循人类给定的训练机制,因为从一开始,“坐隐”研发团队就没有为“坐隐”提供任何训练机制——
依托全新的深度学习算法,“坐隐”为自己设计了训练机制,并根据自行创造的训练机制进行自我对弈,并在这一过程中不断地改进自己的训练机制;换言之,作为人工智能,“坐隐”不仅拥有了学习能力,还掌握了如何学习的本领。
最后一次读秒开始,坐隐必须要在三十秒内落子。
周弦的手自棋罐内拿出,紧紧拽住了西装下摆。
倒计时还剩十秒,电子女声开始倒数,周弦的额头渗出细密的汗珠。
女声计数到“六”,屏幕上,多了一颗黑子——
黑子落在了棋盘的横纵线条构成的方格之中。
陡然间,周弦眼前金星乱冒——
围棋棋子必须下在棋盘横纵线条构成的交叉点上;落于交叉点之外,属于无效落子,相当于投子认输。
“‘坐隐’中盘负。”裁判长琼森宣判了比赛结果。
“承让了。”格林用蹩脚的中文说。
周弦勉强挤出笑容,低头收拾棋子。两分钟后,周弦和格林走出对局室。过道两侧,闪光灯和快门声此起彼伏。周弦前往“坐隐”的控制室,工作人员为他驱赶簇拥上前的记者。走进控制室,五十平米左右的房间内鸦雀无声,周弦顺着研发团队人员的目光看向控制室的大屏幕,瞬间怔住——
屏幕上显示着一个坐标,有着三个数值,且数值均为10。
这意味着,“坐隐”的最后一手棋,居然落在了一个三维坐标(10,10,10)上!
围棋棋盘纵横十九道,共形成19×19共361个交叉点。从数学的角度来看,围棋棋盘是一个二维直角坐标系,棋盘上的每一个交叉点都能被唯一的二维坐标所定义。因此,“坐隐”落子,相当于给出一个坐标,系统根据坐标将棋子显示在虚拟棋盘相应的位置上。而当“坐隐”给出一个三维坐标的时候,系统顿时陷入茫然无措的境地:一个二维直角坐标系,如何接纳一个三维坐标?面对三维坐标,系统出现了小幅度的崩溃,而“坐隐”这手棋,就此落到了毫无意义的交叉点之外。
“我需要调用‘坐隐’半小时前的行为日志。”周弦说。话音刚落,团队内的高级算法工程师赵若飞输入了一行命令,屏幕上的三维坐标淡出,取而代之的是一个缓慢转动着的立方体框架,框架内,横、纵、高三个方向的线条相互交错,彼此垂直,将立方体切割成一个又一个独立的小立方体区间。“这是三维直角坐标系……”周弦的声音微微颤抖,“或者说,是一个三维棋盘。”
“不仅如此。”赵若飞说道,按下回车。屏幕上,一颗黑子出现在了立方体正中,而在立方体最外围的一个面上出现了一百多颗棋子——倘若将这个面单独截出来,那便是“坐隐”下最后一手之前的决赛对局。
“‘坐隐’赢了,赢了一个维度。”周弦深吸一口气,转身走出控制室。
“在发布会上,您要怎么说?”赵若飞急切地问。
“如实说。”
“在决赛中,‘坐隐’下出了三维围棋。”
发布会上,周弦说出了他的第一句话。格林侧过身体,正对周弦,瞪大眼睛。台下的记者一片哗然,周弦不得不停顿片刻,等到台下略微消停后才继续说道:
“‘坐隐’没有接受任何人类设计的训练机制,而是在‘深度学习’之中自己生成训练机制。在日复一日的自我对弈之中,‘坐隐’的‘深度学习’发生了质的变化——
“它从根本上颠覆了之前的训练机制,为二维的围棋棋盘增加了一个维度。
“二维的围棋棋盘本质上是一个二维直角坐标系,若再为它加一根与之相垂直的坐标轴,我们就得到了一个三维直角坐标系,也就是一张三维棋盘。二维棋盘上,横19路,纵19路,共计361个交叉点;而在三维棋盘上,横19路,纵19路,高19路,19×19×19,一共有6859个交叉点。而二维围棋的所有规则,在三维围棋中依旧成立。
“从某种意义上来说,‘坐隐’之所以创造出了三维围棋,其实缘于我们的疏漏。我们向‘坐隐’输入了围棋规则,对于棋盘边数、玩家数目、胜利条件、禁着点等各种情况都作出了严格的规定,但唯独对棋盘的维数没有作出严格的限制——具体到实际操作,便是在代码层面,我们对棋盘的维数给出了一个不严谨的描述。这是一个不应有的疏漏,它来自我们认为围棋棋盘只可能是二维平面这一惯常的认知;但正是这一疏漏,给‘坐隐’的深度学习打开了更广阔的空间,使它得以突破维数的制约,创造出了三维围棋。
“从二维围棋上升到三维围棋,这就是‘坐隐’长考的内容。在初步掌握了三维围棋后,‘坐隐’将正在进行中的决赛对局视作一场发生在三维棋盘上的棋局。在‘坐隐’看来,决赛对局中所有的棋子都落在了三维棋盘最外围的一个面上,而对于这盘下在三维棋盘上的对局而言,当前最佳的一着绝非局限于二维平面,而存在于广阔的三维立体空间之中——
“于是,他的下一手棋,就落在了一个数值为(10,10,10)的三维坐标上;或者说,落在了三维棋盘的正中央。
“二维棋盘显然无法接纳三维坐标,因此系统不可能将这一落子正常地显示在二维棋盘上。最终,这一无法在二维棋盘上呈现的落子就出现在了棋盘的方格内部。”
“周先生,您真的……不容易。”格林的脸上浮现出古怪的笑容。
“蒙您夸奖。”周弦微笑着点了点头。
“能把输棋说得如此清新脱俗,古今中外,恐怕也只有您一个人了。”
“您不相信?”
“我是学者,相信实证。”格林说,“我会等您的证明。”
“我现在就能证明。”周弦说,“如果主办方允许的话,‘坐隐’就在这里为各位下一盘三维围棋。”
经过五分钟的短暂讨论,主办方同意周弦在发布会现场进行三维围棋的演示。又过了十分钟,位于控制室的“坐隐”研发团队完成了演示所需的系统设置。同时,发布会的讲台上架起了一块八十七寸的大屏幕,通过无线网络与“坐隐”的控制室相连。一切就绪,位于控制室的赵若飞单击鼠标左键,“坐隐”开始按部就班地运行。
和周弦在控制室看到的画面基本一致,屏幕上出现了一个大型的立方体框架,框架内布满了纵横交错的线条;但有所不同的是,为了让观众看得更清楚,框架内的线条有加粗,线条交错所构成的交叉点即落子处用一个灰色小球标记。在完善了显示效果后,三维棋盘惊心动魄的复杂性得以呈现在全世界面前:一根又一根交错的线条排列成浩瀚的阵列,线条与线条之间的交叉点密密麻麻,由于透视关系的存在,明明彼此垂直或平行的线条大部分却相互倾斜或者重叠,数千个交叉点拥挤在屏幕上,以看上去极其无序的方式排列,就像有人在屏幕上撒了一把胡椒面,然后把这些胡椒面以直线相连,整个棋盘呈现出人类难以理解的庞杂与混乱。
一切就绪,对局开始。黑子落下,一个体积是顶点处灰色小球两倍大的黑色小球落在了棋盘偏左下角的一个交叉点上;半秒钟后,代表白子的白色小球出现,与黑子相距五个交叉点。黑白交替落子,棋盘上的棋子数目很快达到了二维棋盘所能容纳的最高数目,但在有着6859个交叉点的三维棋盘上,这些棋子在分布上仍旧相当稀疏。
“就到这里吧。”十五分钟后,周弦说道,“事实上,‘坐隐’在三秒钟内就已经下完了整盘棋,但为了能清晰地展现棋局进程,我们放慢了演示速度。”
“周先生,请容我提醒您:即使是三维的程序错误,那也是程序错误。”格林说道。
“就今天这盘棋来说,这就是程序错误,毫无疑问。”周弦对格林拱一拱手,“恭喜DigitGo又一次赢得了冠军。”
“请问二位,如果‘坐隐’在二维棋盘上再次与DigitGo相遇,你们认为结果会如何?”一名记者问道。
“在‘坐隐’学会三维围棋之前,它与DigitGo的对局就已经回答了您的问题。”周弦笑着说,“降维打击不仅适用于文明之间,在围棋的世界里也同样通行。”
“周先生,我本来不愿意在这个场合说出我的真实想法,但您的挑衅使我忍无可忍——恕我直言,三维围棋只是一个谎言,而‘坐隐’从头到尾都在所谓的三维棋盘上满盘乱下!”格林面色铁青地说,“事实就是,‘坐隐’被DigitGo逼出了一个复杂的程序错误,这并不耻辱,但也绝对不怎么高明。”
“格林先生,‘坐隐’究竟有没有乱下,我应该更有发言权吧。”一名坐在前排的青年说道,“我请求与‘坐隐’在三维棋盘上对局。”
青年名叫木可,来自中国,年仅二十岁,已斩获五个围棋世界冠军,在十七岁时击败韩国围棋第一人朴正梓,位居世界围棋职业棋手等级分排名第一位并保持至今,今年受邀成为第七届世界围棋人工智能大赛的解说嘉宾。两年前,作为当今世界围棋第一人的木可曾与当时的最强围棋人工智能DigitGo进行过一场人机大战,DigitGo以3:0的全胜战绩零封木可。这是人类职业棋手第三次以正式比赛的形式挑战围棋人工智能,而结果与前两次毫无差异——自从2016年AlphaGo以4:1战胜李世石以来,在三尺棋枰,面对人工智能,人类已经失去了任何胜算。
“您能和‘坐隐’对局,是我們的荣幸。‘坐隐’随时随地恭候您的挑战。”周弦平静地说道,但内心却雀跃不已。相对于请职业棋手来评判“坐隐”的棋局,由“坐隐”和职业棋手对弈显然更有说服力,并且在围棋的世界里,棋力的强弱本质上只能由胜负来证明。
“在下这盘棋之前,我有两件事要和您的团队确认一下。”木可说,“第一,能不能给我安排一款三维围棋对弈程序?三维棋盘几乎不可能在现实中被制造出来,所以要下三维围棋,恐怕只能靠电脑了。”
“您放心,绝对没问题。”
“第二,三维围棋显然要比二维围棋难得多,所以我需要一些时间来作研究。”木可挠了挠脑袋,“这段时间可能会比较长,希望您和您的团队能耐心等待。”
“我猜‘坐隐’也是这么想的。”周弦笑道。
“那就行咯。”木可走出发布会大厅,挥了挥手,“周先生,后会有期。”
木可之所以提出要和“坐隐”下三维围棋,来自职业棋手的本能冲动和对未知事物的强烈好奇。而当木可收到“坐隐”研发团队制作的三维围棋对弈程序,他就像是孩子收到新奇的玩具一般惊喜,在他眼前呈现的是一个前所未见的神奇棋盘,还有宛如电竞选手一般的下棋方式:
以W、A、S、D四键控制光标在三维棋盘中来回移动,从而控制棋盘在屏幕上的显示区域;通过按动鼠标右键并拖动鼠标,就能连续转换观察棋局的视角,而最常用的鼠标左键承担了落子的功能。整个操作复杂而又奇特,木可用了半个多小时才适应。
当木可试着在三维棋盘落子,他对于三维棋盘的复杂性才有了深刻的体会。要在三维棋盘上下一手棋,要穿越层层叠叠的平面,穿透纵横交错的线条,在星罗棋布的交叉点之间来回穿梭,最终才能找到心仪的选点。而视角一旦发生转变,棋盘在眼前的模样就会发生巨大的变化,不仅仅是屏幕所显示的棋盘范围发生改变,还有因透视关系的变动,导致棋子之间的位置关系在二维屏幕上发生的变动,虽然实际上棋子之间的位置关系并未发生任何变化。
而當木可开始对三维围棋进行深入的研究,他才意识到自己完全低估了三维围棋的难度。三维围棋最艰深之处并非几何级上升的变化数量,而在于棋手永远无法全面地观察三维棋局。作为三维生物,人类能看到二维棋盘的全貌,包括任何一颗棋子与它周边所有棋子和空点的位置关系;而当人类观察三维物体的时候,人类所能看到的永远是三维物体的局部。就比如当一个人看到一张纸的正面时就不可能看到它的背面。因此,面对三维棋局,无论棋手的视角如何变化,他都永远不可能看到棋局的全貌,哪怕是一颗棋子的全貌——更严格地说,是不可能看到一颗棋子与其他棋子和空点的位置关系。于是,面对三维围棋,人类的视角始终受限,思考的困难程度就上升到了一个空前的层次。
面对剧幅增长的变化数量和永远受限的视角,木可心中产生了深刻的无力感和失控感。他感觉自己进入了一个极为浩瀚的迷宫,其中隐藏着近乎无穷无尽的未知领域。在第一周的研究之中,木可一无所获,绝大多数时间都在瞪着屏幕发呆,偶尔在棋盘上摆上几手,也完全没有章法可言。
转机出现在第十二天,那天下午,木可登录网络围棋平台“弈风”,以匿名对局的方式放松一下心情。棋局进展到第九十七手时,木可的白棋就已占据胜势,只消再花一手棋就能彻底完成对黑棋三十二子巨龙的封锁。木可正要点击鼠标落子,他忽然意识到这一幕似曾相识:当初,“坐隐”就是在这样的必胜时刻陷入长考,在长考之中以三维围棋的视角去审视二维棋局。所以,倘若自己站在“坐隐”的角度,将眼下的局面视作发生在三维棋盘上的对局,那么自己又会怎么下呢?
木可打开三维围棋对弈程序,将当前的棋局一一摆在三维棋盘最外围的一个面上。摆上最后一子的时候,木可在“弈风”的必胜之局被判超时负。五小时后,木可落子,这是他在三维棋盘上正式下出的第一手棋,而这手棋成为了三维围棋研究的突破口——
当他站在三维围棋的视角审视二维棋局,便是强行将自己的思路从二维围棋向三维围棋转换。于是,他就打破了三维围棋和二维围棋之间的思维壁垒,继而找到了三维围棋和二维围棋之间的隐秘关联,正是这些关联为木可带来了三维围棋的一部分基本攻防手段。
两周后,木可在网上公布了自己的研究成果,通过程序自带的动画截取功能将他下出的攻防手段以三维动画的形式予以呈现。“这是从零到一的突破。”对于木可的研究成果,周弦在社交网络发表了自己的评论,“在本质上,任何棋类都是一类自洽的数学体系。三维围棋和二维围棋有着完全相同的规则,意味着两者在数学上必然存在着某种隐秘的联系,这一联系尚未被数学家以数学语言来表达,但已能被职业棋手所感知——这或许就是我们所说的‘棋感’吧。”
在职业棋坛,对三维围棋感兴趣的不止木可,中日韩共有两百多名职业棋手同时在研究三维围棋。当包括木可在内的职业棋手对三维围棋的研究日趋深入,他们就有能力解读“坐隐”在发布会上下出的那盘未完成的三维对局。职业棋手一致认为,当时“坐隐”绝非满盘乱下,但所掌握的也不过是木可在研究初期所下出的基本攻防。从周弦每周公布的“坐隐”的棋谱来看,“坐隐”的棋力增长速度与人类相近,而与当年的AlphaGo相距甚远。因此,大部分职业棋手认为,木可和“坐隐”的棋力在伯仲之间。
随着时间的推移,越来越多的棋手加入到了三维围棋的研究之中,但放眼棋坛,对三维围棋最用心的仍是木可。在研究三维围棋的这一年里,他平均每天花在三维围棋上的时间超过十二个小时。与此同时,在国内外棋战之中,木可的表现却一落千丈。在中国围甲联赛中,木可的年度胜率降至三成,而在世界围棋赛事“野狐杯”和“乌鹭杯”中,身为种子选手的木可两度脆败于朴正梓之手,当今世界围棋第一人的宝座已经岌岌可危。
“木先生,您如何评价您这一年来的战绩?”在木可与“坐隐”对局前的记者发布会上,有记者问道,“您即将与‘坐隐’的对决是否影响到了您这一年来的发挥?”
“这一年里最重要的棋还没下,你叫我怎么评价呢?”木可笑道。
“对您来说,和‘坐隐’对局比拿世界冠军还要重要吗?”
“棋手要下出自己的围棋。”木可说,“这就是我现在正在做的事情。”
“但您有没有想过,您的围棋,会不会下错了地方?”
“下错就下错吧!”木可笑容灿烂,“就算下错了,我也下出了自己的围棋。”
第二天,木可与“坐隐”的对局如期展开。双方用时各四十小时,时间耗尽后,进入一分钟共五次的读秒阶段。每天对局时长为八小时,上午和下午各四小时,分别于上午八点和下午两点开始,中间有两小时午休时间。对局室是一间六十多平米的房间,居中是一桌、一椅、一台计算机,计算机内安装有三维围棋程序;在距离这副桌椅约一米远的地方是裁判席,也是一桌、一椅、一台计算机。由于对局只能通过计算机程序这一虚拟媒介进行,因此对局室的陈设不再遵循典雅的中式风格,而采用了简约的北欧设计:黑白色调,线条利落,带有隐隐的科幻感。
上午八点,对局开始,双方猜先。猜先的流程效仿了人类围棋规则,由“坐隐”随机生成一个介于1—3430之间的自然数——3430是三维棋盘交叉点数目除以二后再四舍五入取整得到的数字,然后让木可猜测这一自然数是单数还是双数,若猜对,木可执黑;反之,木可执白。木可单击左键,在棋盘上摆上两颗黑子,代表双数;半分钟后,屏幕上显示数字42——
猜先结果:木可执黑,“坐隐”执白。
木可整理了一下西装衣襟,挺直背脊,左手置于键盘W、A、S、D四键上方,右手轻轻握住鼠标。“对局开始。”电子女声响起,紧接着电子钟开始计时。木可操纵键鼠,调整视角和光标位置,一分钟后,双击鼠标左键,落下一子。
全天八小时的对局,木可目光平静,面无表情;除了双手因操纵键盘鼠标而略有移动之外,木可的身体几乎纹丝不动。在与“坐隐”的对局过程中,木可感到自己置身于棋盘内部,在纵横交错的线条之中来回穿行;但同时,他又感到自己的身体处于静止状态,以他的身体为基准,棋盘的纵横网格和落在交叉点上的棋子在他的眼前旋转、平移;两种认知并不冲突,各自独立却又相互兼容,以各自的参考系向木可展现完全相同的棋局进程,并且屏蔽了棋盘之外的世界——
当木可的感官身处三维围棋内部,主观意识就停止接受来自棋盘外部的信息;三维棋盘的无形边界变成了一堵看不见的墙,将木可困在了这处体积未知但显然十分有限的空间。但木可并不觉得逼仄,相反,眼前的空间比他去过的任何地方都来得广阔。这一错误的空间感并不仅仅缘于三维棋盘的错综复杂,更是因为三维棋盘内部蕴藏着6859!①之巨的变化——它们赋予空间以更为宏伟的意义,并被木可清晰地感知。
当天对局中止的瞬间,木可的腰部一下子塌了下去。赛后木可接受了记者的短暂采访,憔悴的他露出了调皮的微笑:
“‘坐隐’很强,但我觉得自己还有机会。请大家放心,本人还可以一战。”
当天晚上,困极了的木可却彻夜失眠。闭上双眼,身体再度置身三维棋盘之中,与“坐隐”的对局按照落子的顺序逐渐浮现,并且在未经主观意识的指引下自行演绎出后续进程。意识仿佛融化进了棋局之中,在似睡非睡之间变得逐渐模糊,天亮的时候,木可睁开眼,脸上露出了酸涩的苦笑。
这一夜过得如此疲惫,仿佛下了一整夜的棋。
从卧室到对局室,木可感觉自己的身体正在以加速度不断下坠,但是他脚下的地面仍旧坚实地支撑着他的身体,于是下坠的感觉和真实的物理空间产生了无法调和的矛盾,坐立行走无不艰难。而在旁人看来,木可憔悴到了极点,看上去根本不足以坚持一整个白天的对局。然而,当裁判长琼森宣布续战的时候,木可突然挺直了背脊,无神的目光陡然间变得平静而专注。
木可感覺自己的下坠戛然而止,身体坠落在了三维棋盘之中。
下午六点,当天对局结束,木可原本挺直的身体整个蜷缩起来,过了五分钟才踉跄着走出对局室。当晚,木可沉沉睡去,无梦地睡了一夜。然而到了第三天晚上,木可再度失眠,棋局又一次在似睡非睡之际于头脑中展开。




