256台Tesla P100支持的OpenAI跟人类打DOTA 2比赛,输了!
DOTA 2是全球最流行的电竞游戏之一,这两天DOTA 2顶级赛事TI8正式打响,很多玩家可能很关注中国参赛队伍的表现吧。除了正常的人类对战,今天上午TI8上还举行了一场有趣的人机大战——一方是巴西的Pain Gaming战队,一方是OpenAI Five,此前OpenAI曾经单挑赢了多位高手,但在TI8这样的顶级比赛上OpenAI Five首战输给了人类。
OpenAI是特斯拉CEO马斯克创立的一个非营利性AI研究实验室,他们的AI研究设计的很广泛,电竞游戏就是其中之一,OpenAI之前已经推出了一些与游戏相关的AI训练机器人,现在使用的是升级版的OpenAI Five,在这次的TI8比赛之前,OpenAI在1v1单挑比赛中赢了职业选手Dendi,本月初还在5v5比赛中赢了多位职业选择组成的战队,而TI8上的比赛是OpenAI正式亮相顶级电竞赛事,不过首战失利了。
从OpenAI团队公布的总结来看,OpenAI Five总体打的不错,但是有一些让人无法理解的失误,比如会在基地、塔下重复打眼,资源分配也不合理,经济上落后于对战的巴西Pain Gaming战队,最终被人类战队抓住机会击败了。
考虑到AI以往的成绩,人类在TI8赛场上击败AI还真不容易,不过这次的比赛对AI战队也作出了限制,双方的英雄是事先确定好的,投币决定两边队伍的选择,更重要的是AI战队的反应速度从之前的80毫秒增加到了200毫秒,这给人类战队赢得了机会。
OpenAI Five是OpenAI的第二代游戏AI了,性能大幅升级,CPU核心数量从之前的OpenAI 1V1 BOT机器人的6万个增加到了现在的12.8万个,GPU从之前的256个Tesla K80增加到256个Tesla P100,训练经验从之前的每天练习(人类水平)300年变成现在的180年/天,不过换成单个英雄的话就是900年/天了。
虽然首战失利,不过后面还有几组人类vsAI的比赛,而OpenAI方面也表示找到了这场比赛中的一些bug,会做改进,要知道AI最强的地方就是不断学习,当2016年谷歌的Deepmind的AlphaGo AI与人类九段选手李世石对战围棋,李世石赢了一局,以4:1输掉了比赛,但这是人类在围棋上最后一次赢过AI了,后续Deepmind升级了AI,对战中国的柯洁,人类毫无胜算了。