你也能跟着阿老师学围棋:AlphaGo教学工具上线,人人可用

安妮 发自 凹非寺

昨晚,一条来自“AlphaGo人肉臂”黄士杰博士的消息又引爆了整个朋友圈和Facebook:

大家好,很高兴向大家宣布,AlphaGo教学工具上线了。

这是一个AlphaGo教学的开局库,相关细节如下:

  1. 本教学工具总共收录了约6000个近代围棋史上主要的开局变化,从23万个人类棋谱中收集而来。

  2. 所有盘面都有AlphaGo评估的胜率,以及AlphaGo推荐的下法。

  3. 所有AlphaGo的胜率与推荐下法,AlphaGo都思考将近10分钟(1000万次模拟)。

  4. 每一个开局变化,AlphaGo都固定延伸20步棋。加上AlphaGo的下法,整个教学工具约有2万个分支变化,37万个盘面。

受限于投稿《自然》杂志的时程,本教学工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教学工具中的创新下法,也能从中有所收获。

——黄士杰

黄士杰博士的朋友圈

也就是说,曾经击败过世界顶级围棋选手李世石和柯洁的AlphaGo重出江湖,化身围棋老师,开始教人类下围棋了。

任何人都可以登陆AlphaGo Teach官网,和聂卫平口中“围棋20段”的阿老师一起学习。

随时,随地。

开始学习!

五月乌镇围棋峰会上,谷歌DeepMind的创始人哈萨比斯就表示,开始研究用AlphaGo教人类更好地理解围棋。

半年过去,AlphaGo Teach真的推出了。项目主页的介绍支持英语、简体中文、繁体中文、日文和韩文阅读ʘᴗʘ。

在项目官网中我们看到,点击棋盘上的彩色圆圈,或使用棋盘下方的导航工具,即可探索不同的开局变化,以及AlphaGo对于每一步棋的黑棋胜率预测。

开局棋盘

在这张棋盘上,浅蓝色虚线圆圈代表AlphaGo的下法,蓝紫色圆圈为人类棋手的下法。圈中的数字为黑棋的胜率,当轮到黑棋落子时,数值越接近100表示黑棋优势越大;当轮到白棋落子时,数值越接近0表示白棋优势越大。

DeepMind围棋大使樊麾昨晚也在微博上为AlphaGo Teach站台,并在表示“在万千变化图中发现了比较有冲击力”的几张图。

原来二路虎不见得好!

对付迷你中国流的新办法

原来这里还可以飞

项目地址

(樊麾温馨提示:打开时请耐心等待几秒)

https://alphagoteach.deepmind.com/zh-hans

AlphaGo的进化

细心的读者已经注意到,黄士杰博士已经说过,这个教程使用的工具为AlphaGo Master,也就是今年5月打败柯洁的那一版。

不得不说,AlphaGo的成长速度非常惊人。

2014年DeepMind开发出最初版的AlphaGo,到了2016年,进化了两年的AlphaGo Lee击败了世界冠军李世石。

从这时起,AlphaGo走进众人视野。

今年5月,棋力大增的AlphaGo Master与柯洁交战,柯洁三负,AlphaGo Master被授予“职业围棋九段”的称号。DeepMind着手将AlphaGo用于人类教学。

今年10月19日,AlphaGo Zero问世。通过自我对弈,经过3天学习,AlphaGo Zero以100:0的成绩超越了AlphaGo Lee的实力,21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。

12月6日,AlphaZero用了5000个一代TPU和64个二代TPU,经过不到24小时的自我对弈后,击败国际象棋、将棋和围棋三个世界冠军级程序。

AlphaZero的百局战绩

多方感慨

AlphaGo教学工具推出后,微博炸了。众多“围棋人”或站台、或感慨。

重新学围棋。

——柯洁 中国围棋职业九段棋手

很多人会担心今后布局的标准化,其实不必担心。教学工具并不是告诉大家“只能这么下”,而是告诉大家“有些下法不太好”以及“可以这么下”。有些图中没有的下法只是因为模拟的随机性而未被收录,它们之中包含很多高胜率的选点,仍可以大胆尝试。

——李喆 中国围棋职业六段棋手

AlphaGo教学工具,是提供给我们更多的想象和可能;而不是提供标准的答案。 是打开我们的心灵,使我们有捷径通往寻求艺术的大门;而不是关闭我们的心灵,从而失去对艺术的求知和渴望。

——胡耀宇 中国棋院围棋八段

“我理解有些朋友期待单机版AlphaGo,但是我们原本就没有计划公布单机版。不过,我们已经发表了论文,其他的AI会复制、借鉴AlphaGo的技术再往前去。”黄士杰博士在朋友圈中说。

诚挚招聘

(0)

相关推荐