天地志 | 下一次太空热潮
Facebook首次披露自研AI芯片细节:
为视频而生,LeCun挂帅
Facebook独立自主研发AI芯片的消息,不是新消息。
但为什么一定要自己做?又打算用来做什么?自主芯片会带来哪些不同?
之前一直没有答案。
5月26日,Facebook首席AI科学家Yann LeCun,在故乡巴黎举行的Viva科技峰会上,首次披露了Facebook在AI芯片方面的具体方向。LeCun说,Facebook之所以自己搞芯片,是因为传统资源无法满足新时代需求,传统方法已经失效,我们需要一款AI芯片,实时分析和过滤视频内容。
具体是怎样一回事?
Facebook首席AI科学家Yann LeCun
为视频需求自主造芯
LeCun说,现在Facebook的视频审核任务越来越重,而且直播带来的实时分析、过滤的压力也越来越大。
比如有些用户在Facebook Live上直播的事情,可能有点不忍直视,还危害公众安全,这时候就需要快速发现并马上拿掉。
但如果通过现行的一般方法,需要耗费大量的计算资源,而且功耗巨大。
“传统方式已经失效”,LeCun说。
而且看得到的趋势是,视频正在成为信息传递的主流方式,不管是实时直播,还是短视频、长视频内容,都对计算资源和功耗提出了更高要求。此外,出于监管的考虑,也需要更高效的硬件处理器。
所以Facebook首席AI科学家认为,不光Facebook,当前大家都有强动力、强需求去设计AI芯片,专芯专用。
LeCun还举例解释,就像越来越多的智能手机配备了功能强大的芯片,可以让用户直接在手机终端就可以完成语音识别、图像解析、视频处理和AR等功能一样,未来,越来越多本来以软件为核心的公司,也会考虑、涉足硬件。
总而言之,就是目前没有最好的方案供应,所以Facebook这样软件公司,也不得不趟一趟硬件的浑水。而且值得注意的是,Facebook自主造芯,不是想抢英伟达、高通的饭碗,只是希望更好支撑服务自己的业务。
值得注意的是,这也是Facebook首次披露自主造芯的具体方向,之前曝出AI芯片传闻时,外界分析和猜测都集中在Oculus、智能音箱等终端设备需求上,而忽略了Facebook的业务核心需求。
此外,LeCun还表示,虽然AI芯片对Facebook是全新的工作,但硬件上我们早就有过试水。在Facebook内部,服务器、主板、数据中心通信芯片等硬件制造相关的事情,之前都以尝试过。
言外之意,即Facebook对自主研发AI芯片很有信心。
不过在这次会上,LeCun没有透露这款AI芯片具体进展到什么程度,何时能够流片或上马应用,目标效能又是啥样的……
当然,LeCun没介绍这些可能也是有原因的——上个月他才开始公开招人。
新组建的AI芯片团队
上个月,LeCun在自己主页发出求贤令,号召ASIC和FPGA相关的芯片工程师加盟Facebook。
在招聘需求介绍中,Facebook称AI芯片项目隶属于基础设施团队,芯片工程师会和软件、系统工程师联手开发,最后目标是推出针对AI、ML、视频压缩和解码等在内的一体化解决方案。
不过招聘介绍中没有指明团队负责人信息,但从LeCun“自曝”履历来看,这个全新的AI芯片团队,可能会由他本人亲自带队。
这位卷积神经网络的开创者可能担心芯片人才“不识货”,还在Facebook推文中强调自己拥有芯片设计的经验,而且我当年学的还是电子电气工程……
求才之急迫,可见一斑。
OpenAI发布强化学习环境Gym Retro:支持千种游戏
Gym 是 OpenAI 发布的用于开发和比较强化学习算法的工具包。使用它我们可以让 AI 智能体做很多事情,比如行走、跑动,以及进行多种游戏。目前,它运行在支持 Python 3.5 和 3.6 的 Linux、macOS 和 Windows 系统上。
OpenAI 近日发布了完整版游戏强化学习研究平台——Gym Retro。在本次发布之后,OpenAI 公开发布的游戏数量将从大约 70 个雅达利和 30 个世嘉游戏增加到了 1000 多个游戏,其中包括对任天堂 Game boy 等各种模拟器的支持。此外,OpenAI 还将发布用于向 Gym 平台添加新游戏的工具。
OpenAI 利用 Gym Retro 对强化学习算法及学习能力的泛化进行了研究。RL 领域之前的研究主要集中在优化智能体以完成单个任务上。Gym Retro 可以帮助研究在概念相似但外观不同的游戏之间进行泛化的能力。
集成工具
OpenAI 还将发布用于集成新游戏的工具。如果你有游戏 ROM,此工具可以帮你轻松创建储存状态、寻找内存位置以及设计强化学习智能体可以实施的方案。OpenAI 已经为希望增加新游戏支持的人编写了一个集成器指南。
集成工具还支持录制、播放将所有按钮输入保存到游戏中的视频文件。这些文件很小,因为它们只需要存储按钮按下的开始状态和顺序,而不是输出的每一帧。像这样的视频文件对于可视化增强学习智能体正在执行的操作以及存储用作训练数据的人工输入非常有用。
Farming奖励
在开发 Gym Retro 时,OpenAI 的研究人员发现很多 AI 智能体学会了 farm 奖励(只专注于游戏得分),而忽略了完成隐藏的真正任务。如上图所示,进行 Cheese Cat-Astrophe(左)和 Blades of Vengeance(右)游戏的智能体都陷入了疯狂得分的死循环。这是 OpenAI 之前讨论过的一种现象:当我们只给强化学习算法一个简单的奖励函数时(如最大化游戏得分),可能会导致智能体出现错误的行为。
对于密集奖励(频繁和增量)游戏而言,最难的地方在于需要进行快速反应,像 PPO 这样的强化学习算法可以很好地应对这种挑战。
在 Gradius 这样的游戏中,你会在每次击中敌人之后得到奖励点数,这意味着开始机器学习的速度会很快。在这样的游戏中生存下来需要你具备躲避敌人攻击的能力:这对于强化学习算法而言并不困难,因为它们玩游戏是逐帧进行的。
对于只有稀疏奖励,或需要计划超过未来数秒策略的游戏,目前的算法还很难应对。Gym Retro 数据集中的许多游戏都是稀疏奖励或需要计划的,因此,处理整个数据集中的内容可能需要开发者找到全新技术。
下一次太空热潮
亚太科幻大会论坛上,Gillian谈她做科普的亲身经验,说普通人也有各种各样的方法参与到科学,比如在学校教育中突出科学小组的存在感等等。谈到科幻小说和科学间的关系时, 她说科幻小说的创作能够弓|导科学的发展方向,但科学知识的发展也会改变科幻小说的知识基础,二者的关系很奇妙。
曾获卡尔萨根奖的郑永春为听众解释了“太空热”:历史上称之为“太空热”的时期,是上世纪的六七十年代。在新世纪,“太空热”逐渐复苏,从飞向月球到飞向火星,最后的边疆在一步步拓展。最近特斯拉往太空发射“了一台跑车,红颜色就代表了它对火星的兴趣。
王炯璐讲述了我们日常生活中技术来源于太空的实例,比如高产的太空种子,比如最早应用在宇航员身上的尿不湿。
蔡文信说"太空热”的危机就是它从来不显示出它的危机,真正的太空探索非常危险,需要大量的人力物力,但是意义非凡。蔡文信和饶骏都是直接工作在太空探索第一线的科学家,所以他们对太空探索的看法惊人地一致。
来自地质学专业的科幻作者滕野,将天文学与地质学联系起来,用非常诗意的语言描述了这条神奇的纽带。在早期的月球探索中,我们用地球地理学知识解释月球的地貌;之后我们在月球找到的岩石印证了地球最古老的岩石年龄--46亿年。
漫天行星也是地球的影子,可以让我们产生很多思考,如果我们星球的位置不在这里,地理环境会有多大的变化?那样也就不会有这样宜居的地球。地球在茫茫宇宙中,实在是太幸运了。
责任编辑 蓥钬
宇宙的未来 现在 过去
四十二史