“全能棋王”AlphaZero来了 人类会失业但不会灭亡

郝俊慧

谷歌自我超越用的时间越来越短。最近,AlphaGo的研发团队DeepMind在arXiv上传最新论文,宣告“全能棋王”AlphaZero诞生。在不用输入棋谱,仅仅告知规则的前提下,AlphaZero仅仅训练了4个小时,便超越了最强国际象棋Stockfish,2 小时超越最强将棋Elmo;8 小时超越了李世石版的AlphaGo。这个成绩,距离AlphaGo Zero 的突破仅不到50天,AlphaGo Zero是第一代无监督学习的“围棋高手”,而去掉了Go的AlphaZero,将自己的不败战绩拓展到三大棋类。

这意味着什么?长期以来,人工智能所需要的无非两点:大量的原始数据和大规模的算力,计算机通过对数据的自我学习,将自己训练成无所不知的高手,打败李世石的AlphaGo便深度学习用了20万到30万个高手之间对弈的棋谱,但AlphaGo Zero完全不依赖于人类数据,它需要的只是规则和算力,如同一个真正的围棋人类天才,尽管没有记过任何棋谱,只凭自己的天赋,便可以下出绝世好棋。去掉GO的AlphaZero,更是变成了一个全棋类高手。

今后,DeepMind关注的下一个领域是蛋白质折叠,人类很多病症,如阿兹海默症(Alzheimer's)、疯牛病(Mad Cow/BSE)、帕金森氏症(Parkinson's)都是因细胞内的蛋白质发声突变,导致错误折叠而造成,如果能实现预测到蛋白质折叠的方向,就可以了解病症形成、生长、分裂、扩散以及转移等不同阶段所表现出来的特定生物活性,从而找到相应解决方案,而这条路径需要强大的算力。

这种“学习能力”的跨界,正让AlphaZero从“弱人工智能”向具备独立意志、能自我进化的“强人工智能”迈进了一大步。

现在来看,比人类聪明的AI依旧掌握在人类手中,这正是一部分乐观人士的看法,无论多么聪明,AI终究只是工具,如何使用仍由人类说了算。但在我看来,这种说法恰恰并不知道何为AI,所谓人工智能,核心在于自我进化,或者更简单地说,由机器人发展机器人,人类的意志不再能控制机器人。

事实上,这样的测试并非谷歌一家在做。美国一家名为Voleon Group的基金投资公司,完全在依靠AI炒股。传统的量化基金,虽然也在做智能化投顾,但基本上算法是由人确定,计算机只是负责计算,但Voleon Group的系统内核在于,是计算机自己写出算法,自己预测,而且它不会告诉你它是如何得出这个结果。

人类工种的消失是必然的。工业机器人的出现,让大批制造业工人成为多余;翻译机、语音识别机的出现,让翻译、速记下岗;腾讯的写稿机器人,让记者这个岗位也有了被替代的可能⋯⋯如果之前还可以说AI只能替代简单的工作,今后十年间,AI完全可以让棋手、投资顾问、警察等貌似需要大量主观意识的工作不再成为人类的专长。

不过在我看来,短时间内具有通用智能、可自我复制的AI还不会出现。严格意义上说,围棋规则和判定棋局输赢也是一种监督信号,AlphaZero还没能做到主动认知对象。尽管随着摩尔定律的加速,算力的提升在未来几年内可能以前所未有的速度前进,但进化赋予人类的天生能力,人工智能通过现在使用的神经网络能否做到,还很难说。

尽管DeepMind的哈萨比斯表示,他们的方法已经远超完美信息博弈的范畴,而且整合了神经科学、认知心理学的原理。但人类用了数十万年才发展出的文明,会在可见的未来里被机器人颠覆吗?或者说由人类智能发展出的人工智能,是否同样具有人类智能中的某些缺陷或者局限性?就算计算机已经可以完美地预测一切,如同《未来简史》中所言,人类的思想或者需求,事实上是由算法控制的需求,那么需要有多强大的算力才能对整个地球和人类进行预测和控制?

阿西莫夫之所以在《我,机器人》中制定机器人三定律,正是前瞻性地看到机器人伦理必定会在它出现之后成为困扰人类最大的难题。如同他在《钢穴》开头讲到的那个故事,侦探贝莱在接到要和一个机器人一起破案的任务之后,缠绕在他脑海中的,并不是案件本身,而是这个机器人会不会替代他的工作。在此后补充的“第零定律”中,“机器人不得伤害人类整体,也不能坐视人类整体受到伤害”将人类整体利益放置所有定律之前,但整体和个体必将冲突的矛盾,让四条定律相互补充却又互为悖论。

但这并不意味着我对人类的未来是悲观的,恰恰相反,正如阿西莫夫所言,“人类不应该拒绝面对危险,而是应当学习如何化险为夷。”现有的工种消失是一定的,现在的你失业也是一定的,但人类会因此灭亡吗?不一定。《钢穴》的最后,解决问题之道是人类和机器人合作走出被钢筋铁骨封闭的“洞穴”。

(0)

相关推荐