最强超算,还有跳舞机器人:“芯片公司” 特斯拉的 “招聘会” 又酷又搞笑
作者/杜晨
来源:硅星人(ID:guixingren123)
“钢铁侠” 马斯克在 Twitter 上可谓是一呼百应了。这不,就连发个招聘会的通告都有十多万人点赞,上万人转发:
虽然名字酷炫至极:AI Day(人工智能日)。但事实上,这个活动很可能是个 “招聘会”。这不,马斯克自己也说了,这一届 AI Day 的唯一目标,就是吸引全世界最优秀的 AI 人才加入特斯拉:
这是自从特斯拉去年 10 月彻底裁掉了整个 PR 部门之后,举办的第二次,也可能是该公司今年的最后一次公开活动了。
为什么开个招聘会都要搞得如此大的阵仗呢?还不是因为特斯拉真的是留不住人。最近,已经在公司勤勤恳恳了 11 年的汽车业务高管 Jérôme Guillen 宣布了离职。除了 Guillen,特斯拉在 AI 方面的团队,特别是负责自动 / 辅助驾驶技术研发的团队,人员流动率也不低。
可能这也是为什么特斯拉的相关自动 / 辅助驾驶功能和技术,一直备受指责质疑,安全性不足,且至今未能达到预定的 L4/5 级别的原因。本周,美国政府还宣布启动了对 Autopilot 以及相关辅助驾驶功能的调查。
再这样下去,马斯克的 “终极计划:第二章”(Master Plan: Part Deux),就要跳票了!
终极计划第二章的第三条:通过大规模的车队学习,开发出比人工驾驶安全 10 倍的自动驾驶能力
所以,特斯拉才要大力地招人!招人!
这次 AI Day,就是为了招人这个目的而举办的。为了吸引最优秀的 AI 人才,这次特斯拉真的把家底全都抖出来了:
今天,特斯拉展示了其内部用于 Autopilot/FSD 自动 / 辅助驾驶算法训练、数据标注的超级计算机 Dojo:
特斯拉也公开了 "路测模拟器",一个用来 “凭空” 生成更多虚拟的路测数据标注数据集的系统。它包括了上千种独特的汽车、行人和物体模型,目前已经为特斯拉积累了数千英里的虚拟路测数据:
更酷的是,马斯克还首次公开宣布了特斯拉正在打造一款 “通用型” 人形机器人的消息!
开个玩笑…… 其实是下面这个。这款机器人叫做 Tesla Bot:
接下来,让我们更详细地了解一下这次 AI Day 的主要内容。
Dojo 超级计算机
虽然 Autopilot/FSD 的表现并不稳定,最近也因为卷入多起事故而备受指责,但毫无疑问,特斯拉仍然是在真实驾驶环境里投放自动 / 辅助驾驶技术,规模最大的汽车公司。
为了保证 Autopilot/FSD 的持续进步,特斯拉需要经常更新它们背后的神经网络模型。模型的更新需要更多的数据、更大规模的训练和更强大的计算性能。事实上,现在特斯拉已经感觉市售的硬件无法满足它的需求了。
所以从 2019 年,特斯拉开始了一个神秘的项目 Project Dojo。而今天,我们终于一睹它的真容:一个可以无缝连接,实现超大规模分布式计算、超高 I/O 带宽的多芯片模组(MCM)超级计算机。
Dojo 的核心是特斯拉自主研发的 D1 处理器:采用 7nm 制程工艺,单片包含 500 亿枚晶体管,线路长度高达 11 英里。处理器采用了完全自定义的指令集设计,32 位浮点计算性能可以达到 22.6TFLOPs。其热设计功率高达 400W。
另外,特斯拉方面宣称 D1 处理器的 I/O 带宽是目前行业最顶级网络芯片的两倍水平。
特斯拉宣称,D1 处理器在浮点计算性能和片外带宽 (Off-chip Bandwidth) 上,都远远领先于谷歌的 TPU 和其它顶级科技公司自己用 GPU 打造的分布式计算阵列的水平:
超高的片外带宽尤为重要,因为对于特斯拉而言,D1 Chip 不是一枚一枚用的,而是可以 1500 枚芯片组成阵列,
再把 25 个阵列放在一块晶圆上,就形成了一个训练模组 (Training Tile)。这才是 Dojo 超级计算机的单元核心。
9PFLOPs 计算性能
36TB/s 带宽
占用空间小于 1 平方英尺
特斯拉宣称 Training Tiles 是目前世界上已完成开发的最强大的多芯片模组。
当然,为了确保在模组化、规模化之后,每一枚 D1 处理器仍然能够保持最高效率运行,模组在 I/O、供电、散热设计等问题上,都面临巨大的挑战。
这一点倒是难不倒特斯拉。马斯克也在会上说:“我们毕竟是一家高科技汽车公司,在处理关键计算设备散热问题上有很多的经验,这些经验也可以套用到 Dojo 上。”
Training Tile 模组采用直流电直接输入模式。单枚模组的总电流高达 18000A。模组上方是一块巨大的液冷散热单元。据 Dojo 团队人士透露,这个散热单元可以实现对整个模组 15KW 功率的散热。
这还没完!
接下来,特斯拉还会再把 Training Tiles 组合起来,每 6 个模组一个机柜:
再把机柜之间连接起来,还能够继续保持单个模组的理论带宽水平:
变成最终的完全体:DojoExaPod 将是世界上(理论)最快的 AI 训练超级计算机。
120 枚 Training Tiles 模组
3000 枚 D1 处理器
超过 100 万个训练节点
高达 1.1 ExaFLOPS(16 位浮点)计算性能
此外,特斯拉还为 Dojo 系统加入了虚拟化设计,可以针对训练使用需要进行分区。这就变成了 DPU:Dojo Processing Unit。
接受采访时,马斯克也表示,目前 Dojo 系统的首要任务是服务特斯拉自己内部需要,包括并不限于路测数据标注、模型训练、跑模拟环境生成更多路测数据等各类任务。
但是,Dojo 本质上是一个 ASIC 属性的计算设备,也就可以被看作是一个通用型的神经网络训练设备。未来,不排除 Dojo 也是可以提供给其它机构使用的。
下图显示了 Dojo 的软件堆栈:
Dojo 的宣布,让特斯拉摇身一变,也终于成为一家芯片公司了。难道任何属性的科技公司,最终都会殊途同归,变成芯片公司?
从目前公开的信息来看,Dojo 简直太酷了。但是需要明确的是,特斯拉上周才刚刚完成了首个 Training Tile 的工作测试,成功在这个模组上面跑了 Autopilot 部门老大、AI 大神 Andrej Karpathy 开发的的 minGPT 模型。
(也就是说,不管今天特斯拉怎么吹 Dojo,后面这些超级计算机的部分,都还是在放卫星……)
Tesla Bot 人形机器人
之前早有业界传闻特斯拉正在开发机器人,没想到是真的。在临近本次 AI Day 末尾的环节,马斯克突然搞了一个 One More Thing,向大家隆重介绍这款机器人:Tesla Bot。
马斯克还邀请 Tesla Bot 上来表演了一段魔性的舞蹈。它活动自如、姿态优美,简直把波士顿动力秒出三条街好吗?
当然,这又是马斯克的玩笑,真的机器人,现在还不能动……
马斯克说:“和 Dojo 不一样的是,Dojo 是真的,Tesla Bot…… 也会是真的。” 也就是说,目前的 Tesla Bot 还只是个壳而已。
至于为什么要做 Tesla Bot,马斯克解释道:“其实说来,我们特斯拉已经是世界上最大的机器人公司之一了。你换种方式思考,我们的汽车,其实就是带轮子的智能机器人。”
(几年前的版本还是 “会跑的 iPad” 呢……)
马斯克表示,把特斯拉在机器人、传感、AI 等技术上的进步植入到一个人形机器人上,好像是有点意思的。
马斯克说:“(这个机器人)当然是对人类友好的。” 它的使命,是代替人类,去完成危险、重复和无聊的工作。
Tesla Bot 的身高是 5 尺 8 寸(大约 172cm),体重 150 磅(约 68kg),行进速度 5 英里 / 小时。
Tesla Bot 是一个人形机器人。但它的头上不会有五官,而是一个屏幕显示一些对用户有用的信息。它的全身包括总共 40 个电动 “关节”,特别是在手部,包含了总共 12 个马达控制的关节。
驱动 Tesla Bot 的则是一块 FSD 处理单元,也就是今天大部分支持 FSD 的特斯拉车型都有的车载计算机。机器人的眼睛,则是几枚 Autopilot 系统的摄像头。
基本上,把特斯拉汽车里的零部件和软件功能扒下来,七七八八拼凑出一个人形机器人,这就是 Tesla Bot 了!
对于 Tesla Bot,马斯克的初步设想是让用户可以对他提出简单的命令,比如 “把那个灯泡装上去” 之类的,它就可以执行。Tesla Bot 是一个 “泛用型 AI 机器人”,而非那种更加复杂的,涉及到人机智慧型交流的机器人。
“我们对于 Tesla Bot 的设计指标,是让你可以轻松地躲开它(不被它追上),而且有很大的机会制服它。” 马斯克邪魅地一笑……
“最好这样的情况不会发生,但谁知道呢。”
目前,Tesla Bot 还处于非常早的开发阶段。马斯克也在台上展示了一台(还不能动)的原型机,并且透露能工作的原型机应该明年能造出来。对于是否、何时要正式进入机器人(特别是特指的人形机器人)的行业,他自己也没有个明确的想法。
特斯拉虽然有种种问题,但不可反驳的是,这家公司能够走到今天,靠的真就是对科技创新的疯狂追逐,和马斯克本人强烈的、谁都无法阻挡的意志。
所以特斯拉能真的造出 Tesla Bot 吗?答案肯定是没问题。未来它能派上什么用场?目前真的没人知道。
也许在未来的某一天,Tesla Bot 可以取代特斯拉在全球各地的汽车制造工厂里面的工人。他们的工作确实危险、重复且无聊。
特斯拉上海超级工厂外部的深夜路边摊(图片来源:品玩)