清华大学孙富春:机器人最后一厘米——精细操作的灵巧手

导读
2016年7月16日,清华大学计算机科学与技术系孙富春教授做客机器人大讲堂,就“机器人视触觉认知计算”与“机械手的灵巧操作”做了精彩纷呈的报告。关于机械手的灵巧操作孙教授在报告中说“机器人是自动化的最后一公里,而用于灵巧操作的灵巧手是机器人最后的一厘米。”

清华大学知名教授(曾经的军人)、国家杰出青年基金获得者、智能技术与系统国家重点实验室常务副主任……周六之前,拥有众多霸气头衔的孙教授在小编眼里是那样神圣和遥不可及。但当传说中的孙教授现身RT创投咖啡厅时,那一切的头衔便都隐藏在了孙教授可爱的笑容之下。

即使来大讲堂听报告的大多是来自企业成功人士或毕业多年的科研人员,孙教授在报告中还是以“明白了吗?”“知道了吗?”这些字眼结束一段深奥的讲话。在小编心里,顿时感觉回到了大学时期,这位站在讲台上的学者,在以最朴实最真诚的态度面对大讲堂的每一位听众。现在,在小编眼里他是一个来自清华大学的和蔼可亲的学者,是用最高调的态度科研最低调的方式做人的清华人。

那么还是让我们来看一下关于《计算机视触觉认知计算》的报告,孙教授都讲了些啥:

机器人传感技术

  

报告中孙教授表示,传感是下一代机器人操作的第一步。研究机器人各脑区是怎样合作来进行跨模态信息处理的,是当今脑科学十大问题之一。

从人的脑和手的运动神经系统的功能和机理仿生出发,研究人手在操作物体过程中信息的感知、编码与融合理论方法,孙教授团队在国际自然科学基金重大仪器项目支持下研制具有视触滑温四模态高精度测量装置,这个装置区别于市场上其他石墨烯材料的机器人皮肤。

他的研究团队在提出硅针概念的基础上研发了第三代机器人皮肤。这种皮肤灵敏度高,可以承受十几甚至上百N的载荷,并且他们还将致力于完全采用光学原理研发全新的第四代多模态阵列传感装置:

跨模态信息表征和目标识别

  

孙教授指出,触觉与图像是同构的。如何理解这句话呢?图像就是一个一个点阵,每个点阵就是像素,大小是灰度;而触觉也是一个一个点,大小是力,因此触觉和图像是同构的,这样就可以将触觉的编码方法用于视觉里面。这一原理的一个应用就是盲人识图,比如在盲人的眼睛处装两个摄像机,将图像编成触觉编码,这样盲人可以通过手来感受外部的世界。

孙教授团队在视触觉信息的编码与融合方面做了大量的研究工作,主要贡献包括视触觉的线性动态系统稀疏编码(LDS-SC)方法和三线程卷积神经网络触觉编码方法,以及基于联合稀疏编码和基于扩展贝叶斯概率推理的视触觉融合方法。

精细操作

  

上面的问题告诉机器人在什么样的环境下,这个物体是什么,那么,机器人怎样操作这个物体呢?机器人抓取物体时候需要解决这个物体是什么、抓什么地方、用什么样的抓取姿态和用多大的抓取力这几方面问题。而精细操作又面临诸多方面的挑战:机械手多自由度逆运动规划复杂、视觉信息不完整、物体的形状多种多样,描述系统的方法越来越复杂、操作也越来越复杂。所以我们要学习人力操作的经验,经验学习是未来机器操作非常重要的方向。孙教授团队已有多项研究工作在CVPR、IJCAI、ICRA、TFS、TPAMI等国际重要会议和期刊发表。

研究展望

  

报告中孙教授对下一代机器人的研究进行了展望,他认为:

第一、下一代机器人更重要的是认知体系结构。比如类脑芯片,支持跨模态信息的处理,如声音、图像、触觉、嗅觉、味觉等。

第二、面向多模态信息处理的联合稀疏编码,本质是如何找到各模态信息激发的相容字典元素集。此外,通过对人的视觉、触觉、听觉皮层如何合作进行跨模态信息融合机理的认知,发展新的跨模态信息融合的理论方法。

第三、经验学习。使机器人具有基于经验学习的能力,从而能够根据经验知识进行分析、预测和推理。如何实现更好地进行经验表达、存储和基于经验知识的推理,用以解决机器人完成训练外的任务,以及应对突发事件,是非常重要的。

第三、人的启发。人是万物之灵,可以从我们自身得到很多启发,人类非常复杂的运动,是不是由一些非常难简单的运动组成呢?比如人的肌肉纤维只有一维运动,但大量的一维运动都是非常灵巧的运动。如果这一观点被证实,我们的很多问题将会变得简单,更容易在下一代机器人的柔和灵巧操作方面做出新的工作。

  

最后,孙教授献给大讲堂一首藏诗:

报告结束时,中关村融智特种机器人联盟的理事长魏法军先生向孙教授颁发了机器人大讲堂的荣誉证书。虽然讲座已经结束,但孙教授为大讲堂留下的学术资源还有待各位听众发掘。明天我们将上传孙教授讲座的速记和PPT内容,望供大家学习。

本文为机器人大讲堂原创团队撰写

转载请联系:robospeak@52lide.com

温馨提示
(0)

相关推荐