AlphGo zero成长轨迹16——人工智能思考的奥秘

2024-05-11 04:49:33

这是 AlphGo zero对 AlphGo Master 版的第14局， Master再次奇迹般执白中盘胜！

本局双方历经了两次大劫争，一次大转换，最终以大龙横死这种暴烈的方式决出了胜负。执白的Master 好像是找到了感觉，再度以弱胜强，就像是神话中的勇士齐格菲尔德击败了巨龙。

棋谱1 （1—45）AI 常见定式大集合

开局就是AI流的定式大集合。

左上黑7点三三多爬一手是AI风格，黑棋虽然先手得角，但白棋的外势一样不坏。

船长从来都不神话点三三的作用，认为这个定式充其量是两分。假如点三三绝对有利的话，那么AI早就把星位占角给淘汰了，这就是铁的证据。

右上黑21以下是多次出现的AI定式。黑棋先手吃通棋筋获得厚势很舒服，不过本局左边正对着白棋的硬头也没有什么作用。但双方大神都明白这一点，做一个妥协吧，总不能好处都得了。

船长的判断：这个定式本质上讲也是一个场合定式。只有在左边黑棋没有发展方向的时候才可以使用，否则先手获得厚势无条件黑好。运用的时候要注意方向。

左下角白42的压很有意思。传统定式往往是A退，AI变化也有B位点。本局白棋就大大方方的压一下，然后占据44位大场。局部实地有损失，但全局很好，这就是Master的大局感吧，真的和人类很像。

黑45双方必争点，正是所谓“天王山”。

船长感觉：C位肩冲很醒目。

棋谱2 （46—64）怪异的进攻

黑47竟然选择从这边拆一！违反了一切人类的棋理。

白48以下连扳打劫是普通的定型。

白58和60的组合手段称得上才华横溢，值得人类学习。

黑61在这里压是一种高效的间接补强手段。说明船长下一图的担心是有道理的。

白62压64飞手段简明棋形舒展，不太在乎实地的得失，颇有人类大师的风范。而且64飞后黑棋下方的潜力彻底被打散了。

这是船长的“伪人工智能”流预想图

黑棋按照经典的“搜根—进攻”理论用尖顶，以下变化之一黑棋未见有利。不知道是否有此担心，黑棋选择47拆一。也许在AI大神的博弈中，右上角不见得被看成谁的厚势呢？

Master和zero区别在哪里呢？

首先科普一下人工智能的小常识。

第一，AlphaGo开发的原理并不是直接在后台利用坐标进行计算，而是像人类下棋一样面对棋盘，先进行图形识别，然后再进行计算。

第二，AlphaGo并非完全依靠大量的计算取胜，也就是说面对一个棋形，AlphaGo会先找到一个“魅力点”，然后再去运算验证。这个和人类高手强调的“感觉—计算—判断”的流程是一致的。

也就是说人工智能更追求的是类似于人类直觉的那种“棋感”，而不光是滴水不漏的计算。

第三，AlphaGo既然是人工智能，强调的是一种深度学习，就要利用大数据。

AlphGo Master 包括之前的版本，是把许多历史上人类大师的经典着手（比如秀策的耳赤之手）都收集起来进行学习，然后在关键时刻更多地利用一种智能，或者说“机器的直觉”，找出最佳的一手。

第四，在利用大数据学习这一点上，AlphaGo zero和Master是有区别的。

Master是大量参考了人类的棋谱，因此从原理上来讲Master的着手更加有人类大师的风范。

而 zero完全是自主学习，就是完全通过自我对局积累数据进行成长，从不参考人类的棋谱，可以说属于“外星人围棋”。

因此 zero完全不受人类“棋感”的影响，即便有和人类相同的着手只能说是“殊途同归”，这样的着手可谓“不二法门，棋之正道”！

也就是说master和zero的根本区别不一定是算法不同，也不一定是运算能力上差别，最大的不同应该是在进行深度学习时采用的大数据不同吧。一个是人类对局，一个是机器的自我对局

当然了，这只是船长的理解，不一定对。但原理应该大差不差。

棋谱3 （65—93）搜根要到这里！

面对黑65的打入，第一感似乎应该77位镇头，而白66竟然二路飞！

也许Master在和zero的斗争中吸取了经验教训，不再走以往那种看似大局，其实华而不实的着手。代之以稳准狠的手段。从下三路开始攻击，类似于“虎爪绝户手”。

以下双方各自整形，手段大同小异。

棋谱4 （94—119）孤棋和远方

白94扳头，既瞄准右上角黑棋的弱余味，还窥视着右边黑棋的孤棋，顺便还对左边的大龙做着遥远的幻想。

这是标准的缠绕攻击，很像是人类的智谋。按照人类解说的惯例，应该说这是意味深长的一手，有一石三鸟的作用。

也许是“轻敌”，面对屡次失败的对手，黑棋展示出了临危不惧的勇气。两块孤棋各自做活，局部也是寸土不让。

白棋102,122两手方向正确。坚持厚势不围空，拼命把黑棋往自己的铁墙上面赶。哪怕左边的空被破掉也在所不惜。

至白118为止，“失之东隅，得之桑榆”。刚才看似还有些不安的右下白棋，隐然已形成20目实空。这就是攻击的收获吧。

棋谱5 （120—155）第一次劫争

白22继续进攻，黑23似乎有失谨慎，白24以下的分断凌厉至极！

黑棋当然可以向外逃跑，但可能是对自己的治孤手段特别自信，在局部引爆了一个天下大劫，可以说是万劫不应。白棋找本身劫材，把黑棋大龙切断了半条。

从结果来看双方得失相当，但从全局上来看白棋似乎有了更多的头绪。

棋谱6 （156—175）大转换

白58点的目的是最高效率把黑棋半条大龙吃掉，因此黑棋在局部也是拼命反击，不想让白棋得逞。

白6次序，黑63选择转换，以下变化必然，黑棋始终得不到白70位打的机会。

至白7为止告一段落。黑棋跑出中央大龙，但右上全体阵亡，目测判断白棋至少占了10目的便宜。

黑75只能切断左边白棋残子进行顽抗。

棋谱7 （176—197）吞吃残子二次劫争

白80靠棋形要点。白86冲找劫的时候儿黑棋已经无法连接，中央大龙只好单独做活。

白94粘找劫的时候黑棋局部先走可以做活，但会有无穷无尽的劫材。于是黑95破釜沉舟把劫粘上。

棋谱8 （198—226）诸神的黄昏

白98要点，否则黑棋利用109位的一路尖能做活。以下对于AI来说就是走走过场，增加一点仪式感而已。

船长感想：

Master再度获得奇迹般的大胜，船长就像盗火的普罗米修斯一样，试图从中窥视AI思考的奥秘。

在观看棋局的进程中，总是忍不住站在白棋的角度。不完全是支持弱者，更是因为白棋Naster的思路和我们人类很像，毕竟这个版本开发的时候，还有很多人类的“数据基因”在里面。而zero开发的时候，已经全都是自主学习了。因此Master看起来多少有些亲近感吧。

赞 (0)