你也能跟着阿老师学围棋:AlphaGo教学工具上线,人人可用
安妮 发自 凹非寺
昨晚,一条来自“AlphaGo人肉臂”黄士杰博士的消息又引爆了整个朋友圈和Facebook:
大家好,很高兴向大家宣布,AlphaGo教学工具上线了。
这是一个AlphaGo教学的开局库,相关细节如下:
本教学工具总共收录了约6000个近代围棋史上主要的开局变化,从23万个人类棋谱中收集而来。
所有盘面都有AlphaGo评估的胜率,以及AlphaGo推荐的下法。
所有AlphaGo的胜率与推荐下法,AlphaGo都思考将近10分钟(1000万次模拟)。
每一个开局变化,AlphaGo都固定延伸20步棋。加上AlphaGo的下法,整个教学工具约有2万个分支变化,37万个盘面。
受限于投稿《自然》杂志的时程,本教学工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教学工具中的创新下法,也能从中有所收获。
——黄士杰
△ 黄士杰博士的朋友圈
也就是说,曾经击败过世界顶级围棋选手李世石和柯洁的AlphaGo重出江湖,化身围棋老师,开始教人类下围棋了。
任何人都可以登陆AlphaGo Teach官网,和聂卫平口中“围棋20段”的阿老师一起学习。
随时,随地。
开始学习!
五月乌镇围棋峰会上,谷歌DeepMind的创始人哈萨比斯就表示,开始研究用AlphaGo教人类更好地理解围棋。
半年过去,AlphaGo Teach真的推出了。项目主页的介绍支持英语、简体中文、繁体中文、日文和韩文阅读ʘᴗʘ。
在项目官网中我们看到,点击棋盘上的彩色圆圈,或使用棋盘下方的导航工具,即可探索不同的开局变化,以及AlphaGo对于每一步棋的黑棋胜率预测。
△ 开局棋盘
在这张棋盘上,浅蓝色虚线圆圈代表AlphaGo的下法,蓝紫色圆圈为人类棋手的下法。圈中的数字为黑棋的胜率,当轮到黑棋落子时,数值越接近100表示黑棋优势越大;当轮到白棋落子时,数值越接近0表示白棋优势越大。
DeepMind围棋大使樊麾昨晚也在微博上为AlphaGo Teach站台,并在表示“在万千变化图中发现了比较有冲击力”的几张图。
△ 原来二路虎不见得好!
△ 对付迷你中国流的新办法
△ 原来这里还可以飞
项目地址:
(樊麾温馨提示:打开时请耐心等待几秒)
https://alphagoteach.deepmind.com/zh-hans
AlphaGo的进化
细心的读者已经注意到,黄士杰博士已经说过,这个教程使用的工具为AlphaGo Master,也就是今年5月打败柯洁的那一版。
不得不说,AlphaGo的成长速度非常惊人。
2014年DeepMind开发出最初版的AlphaGo,到了2016年,进化了两年的AlphaGo Lee击败了世界冠军李世石。
从这时起,AlphaGo走进众人视野。
今年5月,棋力大增的AlphaGo Master与柯洁交战,柯洁三负,AlphaGo Master被授予“职业围棋九段”的称号。DeepMind着手将AlphaGo用于人类教学。
今年10月19日,AlphaGo Zero问世。通过自我对弈,经过3天学习,AlphaGo Zero以100:0的成绩超越了AlphaGo Lee的实力,21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。
12月6日,AlphaZero用了5000个一代TPU和64个二代TPU,经过不到24小时的自我对弈后,击败国际象棋、将棋和围棋三个世界冠军级程序。
△ AlphaZero的百局战绩
多方感慨
AlphaGo教学工具推出后,微博炸了。众多“围棋人”或站台、或感慨。
重新学围棋。
——柯洁 中国围棋职业九段棋手
很多人会担心今后布局的标准化,其实不必担心。教学工具并不是告诉大家“只能这么下”,而是告诉大家“有些下法不太好”以及“可以这么下”。有些图中没有的下法只是因为模拟的随机性而未被收录,它们之中包含很多高胜率的选点,仍可以大胆尝试。
——李喆 中国围棋职业六段棋手
AlphaGo教学工具,是提供给我们更多的想象和可能;而不是提供标准的答案。 是打开我们的心灵,使我们有捷径通往寻求艺术的大门;而不是关闭我们的心灵,从而失去对艺术的求知和渴望。
——胡耀宇 中国棋院围棋八段
“我理解有些朋友期待单机版AlphaGo,但是我们原本就没有计划公布单机版。不过,我们已经发表了论文,其他的AI会复制、借鉴AlphaGo的技术再往前去。”黄士杰博士在朋友圈中说。
— 完 —
诚挚招聘