谷歌AI玩游戏又有新突破,这次不只是下围棋

科技洞察 丨 深入科技行业最前沿

我们一直在讲,这一轮的人工智能主要有三个方面的特点:计算能力,算法和数据。

在这三个特点中,计算能力主要依靠大公司的云平台,因为各大IT公司比如微软、谷歌都把自己的人工智能平台开放出来了;而算法往往是开源的,比如谷歌的TensorFlow在内的AI工具,开发者可以直接拿来用,再做一些调整和优化。

最近发生的几件人工智能领域的科技突破,都跟IT巨头公司有关,比如谷歌、IBM。这些技术上的突破,让我们惊喜地看到,人工智能的算力和算法还在不断快速地进化。

人工智能三个特点:

第一:计算能力

现在有了云计算,有了开放平台,你只需要能够接入互联网,就能享受到谷歌、Facebook、微软这样的公司提供的最强大的计算能力的支持。

第二:算法

很多人工智能算法是开源的,而且随着它的迅速的扩散,变得越来越开源,越来越通用。很多不懂人工智能算法的公司,也可以调用算法去做人工智能的开发。

第三:数据

目前主流的人工智能应用,比如机器学习,数据是非常重要的。有了海量的数据支撑,人工智能才能够不断学习、进化。比如图像识别、人脸识别等等。

▏未来计算能力:80年的破解时间,缩短为8小时

我们的银行、医疗保健、军事情报,都离不开加密技术,在以前看来,传统的加密系统几乎不可被破解。然而在量子计算面前,传统的加密技术显得不堪一击。

量子计算机比传统的计算机功能强大得多,能够轻松破解这些密码。近日谷歌的 Craig Gidney 和瑞典斯德哥尔摩 KTH 皇家理工学院的 Martin Ekera 公布了关于量子计算的最新研究成果,其研发的量子计算机8小时可以破解2048位RSA加密。

8小时是什么概念呢?目前最好的超级计算机,破解它需要80年。

RSA加密算法是一种加密算法。在公开密钥加密和电子商业中被广泛使用。

顺便说一句,RSA也是包括比特币在内的电子货币的基础。

这项研究比业界预想的更早赶上当前的加密技术标准,这对于有着长期数据安全储存需求的行业提出了警醒。

值得注意的是,在量子计算领域,谷歌公布最新研究成果并不意味着谷歌已经处于一家独大的状态。中国正在建设一个价值100亿美元的量子应用研究中心。在合肥,一个占地300多万平米的量子信息科学和技术国家实验室即将完成;欧盟于2016年宣布将重点布局包括计算和通信在内的四个量子技术领域。

IBM云计算和认知软件高级副总裁Arvind Krishna在2019年5月的一次演讲中大胆预测:量子计算机将在五年内成为主流。但「华尔街日报」在最新一期的评论表达了担忧:这一轮的量子计算竞赛,无论谁先完成了量子计算的真正突破,都能够否定人类迄今为止所做过的所有加密工作。

但好消息是,各国IT巨头已经开始行动起来,世界上许多最聪明的数学家和网络安全专家正在研究新的加密方案,比如量子安全加密。

除了量子计算在算力方面的突破,人工智能算法也有了新的进展。谷歌母公司Alphabet Inc. 的DeepMind人工智能实验室,在人工智能玩多人游戏方面有了新的突破。

AI在游戏进化:游戏胜率远超人类

《雷神之锤 III 竞技场》是一款第一人称射击游戏,简单说就是在一张给定的地图中,红蓝双方保护自己的旗子并抢夺对方旗子,5分钟时间内,夺旗次数最多的队伍获胜。

跟下围棋不同,这款多人游戏中涉及到策略、战术、团队配合,对人工智能来说都是很大的挑战。然而研究的结果表明,人工智能无论是跟同类打配合,还是跟人类组团,都配合的天衣无缝,甚至胜率远超人类玩家。

DeepMind研究人员在发表于《Nature》的论文“Human-level performance in 3D multiplayer games with population-based reinforcement learning”中介绍了一种AI系统,这种系统不仅能够在《雷神之锤Ⅲ竞技场》中学习如何夺旗,而且制定了全新的团队游戏策略。

在这种人工智能系统的学习过程中,主要依靠自学来打游戏。这个过程中科学家不会告诉AI如何玩这款游戏,只是给它一个胜利或失败的反馈,连科学家自己都不知道AI会表现出哪些行为。

下面的视频可以看到人工智能打游戏的第一人称视角。

这个AI学习的过程叫做强化学习。通过对正确的行为给予奖励反馈,从而获得正确的行动模式,就是基本的强化学习过程。研究人员不断优化智能体的内部奖励机制以及施加于这些奖励的强化学习,从而获得取胜之道。

DeepMind 科学家和伦敦大学学院计算机科学教授Thore Graepel教授说:

“这个项目最非比寻常的一点,就是这些智能体像人类玩家一样,以第一人称视角来感知环境。为了学习如何与队友进行战术配合,这些智能体必须依赖来自游戏结果的反馈——但是没有任何人教它们怎么做。”

通过研究人员的特定算法,AI参与了 45 万场夺旗游戏,这相当于一个人类四年左右的游戏经验。

完全训练好的人工智能学会了类似于人类的行为,变得越来越聪明。比如知道什么时候跟随队友、什么时候在敌方的基地扎营以及保护自己的基地免受攻击。最终,人工智能的胜率远远超过了人类玩家。

在一项对参与者的调查中表明,人工智能相比人类玩家更具合作精神。

从下图我们看到,与“厉害”的人类玩家的 1300 和普通玩家的 1050 相比,人工智能的获胜能力值为1600。

图片来源:DeepMind

DeepMind科学家和伦敦大学学院计算机科学教授Thore Graepel表示,该研究突出了机器学习在推动人工智能发展方面的潜力。例如,它可能会为人机交互(相互补充或协同工作)系统方面的研究提供重要参考。


你一定想知道,训练人工智能来打游戏,有什么意义呢,是不是大材小用了?

这是个好问题。其实,DeepMind公司的使命很大,他们的口号是: 首先解决智能问题,然后用智能解决一切其它问题。 你看,他们开发出人工智能不只是为了打游戏,而是为了解决世界上的一切问题。

眼下的人工智能,只是在特定领域,反馈目标明确下学习获得的智能,也就是弱人工智能。与弱人工智能相对,能够模仿人类学习的人工智能叫做强人工智能或通用人工智能。在硅谷, Facebook和微软公司等公司的研究人员一直在努力开发超越图像识别或翻译语言这样的单一任务学习的人工智能。

据DeepMind的科学家说,这种技术将开辟新的应用,比如自动驾驶汽车或协作机器人,可以在工厂、物流仓库、城市街道甚至家庭与人类更无缝协作。而训练人工智能玩游戏是科学家打开AI巨大潜力的第一步。

看了今天的介绍,相信你对下一代计算和人工智能应该有了一定的了解。基于这种了解,你还能发现哪些别人没太注意到的,可以用人工智能帮助提升的领域和应用呢?

欢迎在留言区分享你的观点。

参考来源:

The Day When Computers Can Break All Encryption Is Coming, The Wall Street Journal, June 4, 2019

Researchers Build Bots That Play Videogames With Each Other, The Wall Street Journal, May 30, 2019

(0)

相关推荐