张钹院士:人工智能独角兽为何不赚钱
如今,频频提及的人工智能(AI)独角兽企业主要分布在交通、金融、医疗、健康、社区服务等领域,估值在70亿~500亿元之间。与此同时,人工智能独角兽企业也暴露出一些问题,比如估值高、销量少。
举个例子,一家估值100亿元的人工智能独角兽企业销售值不到1亿元,意味这家企业没赚钱。其实,大部分人工智能独角兽企业都没赚到钱,或者说这些企业没有找到合适的市场。为什么会出现这种情况?
并不完全是人工智能独角兽企业没做好,问题出在当前人工智能的技术上。这些人工智能独角兽企业的主要技术支撑来自大数据深度学习方法。
其优势在于可以为图像处理、语音处理、文本处理等提供一体化的解决方案。借助该优势,人工智能独角兽企业搭建了自己的深度学习平台。
目前这样的深度学习平台有TensorFlow、PyTorch、百度飞桨、清华校友办的OneFlow等,呈现出一派欣欣向荣的景象。但它们为什么不赚钱?问题出在哪里?算法(模型)和数据的不安全性是重要的原因。
数据的不安全性在于人工智能的发展需要大量数据,但由于产业发展初期的无序竞争,忽略了知识产权和个人隐私信息的保护。
早期数据已经存在被滥用的情况,数据安全性也就缺乏有效保障。如果从现在开始整治,估计企业就不好受。
比如,网络产业利用了掌握用户数据的优势,相关行业的网购几乎拖垮实体经济,这显然不合理。网络垄断了用户的数据,进而垄断了销售,这就需要治理。
下面重点谈谈人工智能算法的安全性。AI算法的安全性是传统信息处理里没有的,或者说人工智能算法的不安全性,是人工智能所特有的。算法为什么不安全?
比如,马和石头语义上相差很远,小孩都可以识别,但计算机可能不行,稍加干扰就会将马识别为石头。为什么会出现这种情况?究其原因是算法很脆弱,易受干扰、易受攻击、会犯严重的错误,这就是人工智能算法的不安全。
如何克服算法不安全性,我们提出发展第三代人工智能的想法,进而发展安全、可信、可靠和可扩展的人工智能技术。如何发展第三代人工智能,基本思路就是一句话,把数据驱动与知识驱动加起来。
我们意识到,现在的人工智能并不是真正的智能,人类智能的源泉是知识,而不是数据。为什么当今社会如此重视数据?
因为计算机处理数据的能力比人类强得多,这也是我们必须承认的计算机所具备的优势。虽然机器有比人类强大的数据处理能力,但也存在着对知识处理办法不多、问题很多的现状。
因此,发展第三代人工智能就需要充分利用四个要素:知识、数据、算法和算力。这四个要素都是不可缺少的。从当前的发展情况来讲,更要强调重视知识。
尽管知识处理带给我们很大的挑战,但从基础研究到产业应用都需要积极面对这个挑战。
首先,知识是多样的,且数量非常庞大。往深里研究,我们会发现由于机器缺乏常识,本质上是很笨的,很多情况下都是鹦鹉学舌,不是机器自己的理解。因此,我们需要帮助机器建立知识库。
一直以来,人工智能做得不够好的原因之一是,知识表达和知识推理的研究缺乏重要进展。不论是用符号还是向量表示知识,计算机处理起来都存在着不少困难和缺陷,目前还没有找到有效的解决办法。
为了克服人工智能算法的脆弱性,办法之一是增加知识,这也是扩大应用场景和促进人工智能产业化的重要途径。
为了处理知识,目前普遍采用的方法是将知识用向量来表示,“向量”计算机很容易处理,因此取得很好的效果。
但是,将知识以向量形式表示时,丢失了语义,也出现了不少新的问题。因此,发展第三代人工智能是一项长期的任务。
另外,发展第三代人工智能技术的基础性研究工作不建议由企业来开展,应该让科研院所和高校来做,这就需要产校合作,可以研究一些新的办法,解决当前和长远需要解决的问题,推动人工智能技术在基础研究和产业应用上的共同发展。
(作者系中国科学院院士,本报记者沈春蕾根据其在2020第三代人工智能产业论坛上的发言整理)
《中国科学报》 (2021-01-07 第3版 信息技术)
编辑 | 赵路
排版 | 志海