在全球人工智能和机器人峰会上，学界大咖都带来了哪些新观点？ / 开普饭

将「雷科技Lite」收藏为我的小程序，不再错过精彩内容

雷科技资讯组

编辑 | 利剑

8月7日，2020年全球人工智能和机器人峰会（CCF-GAIR 2020）在深圳正式开幕。

诞生于2016年的CCF-GAIR，致力于打造国内AI和机器人领域规模最大、规格最高、跨界最广的学术、工业和投资平台。CCF-GAIR 2020峰会由中国计算机学会主办，香港中文大学（深圳）、雷锋网联合承办，鹏城实验室、深圳市人工智能与机器人研究院协办。

2020年，新基建浪潮风起云涌，AI、5G基站建设、大数据中心、工业互联网、城际高速铁路和城市轨道交通、新能源汽车充电桩、特高压等七大领域迎来历史发展机遇期。

“十年一遇”的新基建大浪潮，碰上方兴未艾的AI产业，CCF-GAIR 2020峰会主题亦锁定在了 “AI新基建，产业新机遇”。

AI新基建，究竟会带来哪些产业新机遇呢？

城市大脑要升级到2.0版本

中国工程院院士、鹏城实验室主任高文，重点分享了智慧城市建设中“城市大脑”的最新发展情况。

智慧城市的核心是城市大脑，城市大脑的核心是视觉认知计算（VCC）。

高文表示，城市大脑要从1.0升级到2.0版本。

城市大脑1.0，是一个以云计算为核心的系统，但由于系统各部分没有很好的分工协调机制，使得系统成本高、响应速度慢、数据的可用性低。

鉴于1.0版本城市大脑存在的诸多问题，科研人员从人类视觉系统中得到启发，进而开发出了2.0版本的城市大脑。

人类大脑和视觉系统具有很好的分工，视网膜、视觉通道、大脑分工协调，在不同阶段采用不同视觉编码模型。

高文表示，城市大脑2.0是一个端边云合理分工协调的混合系统架构，可以有效解决城市大脑1.0存在的大部分问题。城市大脑2.0的核心，是数字视网膜及其标准化，其具有以下四大特性：

先进视频编码技术：节省存储和带宽50%以上；
定制ASIC边缘计算：节省云计算资源90%以上；
原始图像上特征提取：低延时和高精度；
标准化特征的提取，存储和复用：显著提升信息密度和价值。

实现AI的三大法宝

作为产业界代表，科大讯飞联合创始人胡郁、京东技术副总裁何晓冬以及依图科技CTO颜水成，分别带来了他们对AI产业化的思考。

胡郁认为，深度神经网络、大数据、涟漪效应，是实现AI的三大法宝。

深度神经网络与大数据的结合成为当前主流路径，而基于互联网和移动互联网的“研究-工程-产品-用户”闭环，又加速了迭代优化的进程。

何为“涟漪效应”？胡郁拿“讯飞语音输入法”举例，早期用户在输入法效果非常差的时候贡献了数据，伴随用户不断给系统贡献数据，系统性能就会不断的提高；随着波纹越来越多，系统误差就会越来越小，就像水波纹的振幅一样。当收集到几千万人的数据时，这时候系统性能已经提高到90%甚至是95%以上。

胡郁指出，在感知智能和运动智能领域，人类、机器和动物处于并列齐驱的水平，而认知智能是人类独有而动物和机器做得不太好的地方，也是目前AI最大的挑战；从现在的研究方向也可看到，自然语言处理、知识图谱等关系到认知智能最核心的领域，深度神经网络并没有给出更好的解决方案。

京东技术副总裁何晓冬，亦是深度学习和自然语言处理领域专家。围绕“多模态自然语言处理技术进展及在工业界的实践”，何晓冬带来了《多模态人机对话与交互：理解、创作、决策》的主题分享。

何晓冬认为，相较于GPT-3这样的端到端的“暴力美学”技术路线，我们可以开展更多基于知识和推理驱动的任务，比如说一些复杂的任务型对话系统，它可以驱动我们研发真正高级的智能模型；我们也需要更多模态的数据，通过海量文本、语音、图像和视频数据，建设跨模态数据集和知识库。

依图科技CTO颜水成，同样是位科研界大咖，他带来了《芯智能，新基建》的主题分享。

颜水成认为，工业界要想让AI走向落地，一个非常重要的点是要让AI的成本降低，让用户用得起；这时候就需要把算法的效能和芯片的效能通过协同开发的方式去形成AI的解决方案，而不是纯粹的算法——这种解决方案称之为“芯智能”。

从“芯智能”的解决方案，到 “算法即芯片”的理念，颜水成指出：

要想打造一款有竞争力的芯片，要清晰明白这个芯片典型的使用场景，它的主要算法以及这些算法在未来几年里可能的发展趋势，然后根据这些信息再去对芯片架构进行优化，以及对工具链做相应的优化，最后实现它们相互的优化，但同时也要保障芯片和算法能够分层解耦。

AI研究的新进展

CCF-GAIR 2020依然是学界大咖的阵地。南京大学人工智能学院院长周志华、香港中文大学（深圳）校长讲座教授黄铠、北京语言大学信息科学学院院长荀恩东、鹏城实验室副主任陈长汶，分享了他们关注领域的最新研究成果。

通过一个破译玛雅历法的真实案例，周志华引入了“反绎学习（Abductive Learning）”概念——从不完备的观察出发，得出最可能的解释。

周志华表示，反绎学习将基于知识的逻辑推理和基于事实/证据的机器学习相结合，有着非常好的应用前景。

我们现在都在谈数据、算法和算力，但是未来不能忽略知识，知识凝聚了人的智慧，过去十几年都从数据驱动做人工智能，现在是时候把数据驱动和知识驱动结合起来了。

作为学界泰斗，黄铠分享了对“5G云、AIoT和边缘计算”的最新思考。

黄铠认为，计算机一定要走向智能化，如果只是高性能计算+序列化的云，那么这样的云计算就缺乏智慧，除了算力、算法，还要有智慧，因此AI、机器学习、深度学习要布局在云端，而且要围绕云端开发边际云（Edge Cloud）。

黄铠还谈到了SpaceX发射的通信卫星。他表示，SpaceX通信卫星未必会取代6G，但毫无疑问会连接大量的IoT设备。目前，SpaceX已发射720个通信卫星，未来会全面增加到12000个。

作为信息和语言学专家，荀恩东认为语音智能的核心问题是“语义理解”。

荀恩东表示，语音智能之所以那么难，是由自然语言的特点所决定的，毕竟自然语言的歧义无处不在；其中歧义包括语义、词法、语法、语意、语用等方面的内容，还涉及到语言多样性，并且面临着知识瓶颈。

基于这个背景，荀恩东提出了语言智能的四类应用，分别是分类、生成、抽取，校对。他还表示，语言关系在数学上可以表现为序列关系、几何关系、数的形态和图的形态，复杂的问题都是这些形态的组合。

做语言理解实际上就是把自然语言做结构化，这种结构化是计算机可操作的一个结构化的方案，这种结构化的方案很容易对接落地的需求。

鹏城实验室，是在深圳设立的主攻网络空间科学与技术的省级实验室。作为实验室副主任的陈长汶，分享了对“视频物联网”领域的思考。

陈长汶认为，视频物联网是新一代的智能化物联网，“感知”“联网”“集成”构成其三部曲。

陈长汶表示，传统的视觉传感器通常为单一应用设计，数据存于本地；新一代视频物联网要求全新的智能化联网思路和设计，具体包括无处不在的无线接入系统、大规模联网的云计算平台以及边缘计算、雾计算等下一代网络计算新架构。

关于视频物联网的技术挑战，陈长汶亦没有讳言，主要包括以下五大方面：

感知前端的嵌入式视觉数据处理；
可靠和自适应的视频物联网通讯链接能力；
基于视频物联网应用的有效搜索和检索；
网络安全和个人隐私的恰当平衡；
建立视频物联网和标准平台。

5G、AI和视频物联网，会擦出怎样的火花？陈长汶表示，5G具有的智能化前端、高宽带低延时联网、全局优化集成以及mMTC应用场景等特征，配合日益增强的视觉传感器AI数据分析和联网能力，将加速视频物联网走向成熟，并为医疗健康、消费电子、智能交通/智慧城市、机器人、工业制造等领域带来重要的行业应用。

结语

为纪念在计算机视觉领域做出巨大贡献的已故华人计算机视觉鼻祖黄煦涛，CCF-GAIR 2020还特别开设了“计算机视觉之父黄煦涛纪念专场”。专场邀请黄煦涛生前好友和学术弟子齐聚一堂，来回忆、总结并探讨黄煦涛在学术生涯中的轶事、学术成就和贡献，以此来纪念这位学术前辈。

黄煦涛（Thomas S. Huang），1936年出生于上海，信息学家，中国工程院外籍院士、美国国家工程院院士，中国科学院外籍院士、台湾中央研究院院士，美国伊利诺伊大学厄巴纳-香槟分校Beckman研究院图象实验室主任。当地时间2020年4月25日，黄煦涛在美国印第安纳州逝世，享年84岁。

黄煦涛主要从事教学与图像处理、模式识别、计算机视觉和人机交互等方面的研究工作，并发明了预测差分量化，被誉为“华人计算机视觉鼻祖”。

据介绍，黄煦涛门下大概有120多个博士生，其中在大陆的“弟子”占到了超过70%的比例。现在，黄煦涛的学生遍布中国前沿科技研究和科创产业领域。即便大师仙去，他的精神以及他的弟子，也将继续影响着中国前沿科技和计算机视觉研究的未来发展。

END

“

在全球人工智能和机器人峰会上，学界大咖都带来了哪些新观点？

相关推荐