清华姚班校友马腾宇 十年磨一剑,遥摘万里星

编者按

2011年1月,清华大学交叉信息研究院成立,由计算机科学最高奖“图灵奖”得主、科学院院士、美国科学院外籍院士姚期智先生领导,是国内首个致力于交叉信息科学研究的教学科研单位。

桃李春风恰十载。姚先生曾言“人生是为一场大事而来”,而清华大学交叉信息院在成立之初就奔着“为国家培养人才”,引领“图灵之路”这般大事而来。

十年间,清华大学交叉信息学院始终以为建设世界一流的交叉信息研究机构,培养具有国际竞争力的拔尖创新人才为目标。其中,创立于2005年的清华学堂计算机科学实验班(姚班)和创立于2019年的清华学堂人工智能班(智班),已建成计算机科学和人工智能领域的人才培养高地;创建于2011年的清华大学量子信息中心,已成为量子计算机和量子网络的重要前沿研究基地。

十年踪迹十年心。十年间,清华大学交叉信息院培养了大批优秀学子,他们从清华出发走向世界,为学科的发展贡献自己的一份力量。今天为大家介绍的,是2012届姚班校友马腾宇。

马腾宇

2012届姚班校友,于普林斯顿大学获得博士学位,现为斯坦福大学计算机科学与统计学的助理教授。研究兴趣包括机器学习和深度学习,深度强化学习和高维统计。曾获得NIPS'16最佳学生论文奖,COLT'18最佳论文奖、ACM博士论文奖荣誉奖和2021斯隆研究奖。

“茶园”故事:忆清春岁月

在茶园(清华大学交叉信息研究院的别称)学习的课程,是马腾宇在清华印象最深刻的记忆之一。他特别提到了姚期智先生的《计算机应用数学》这门课:“当时姚先生给出了一个拜占庭将军问题,我们大家都想了很久也没有给出一个很好的解法。即使后来我们有一些进展,但也都是比较局部的解决。”另外,孙晓明老师开设的《理论计算机I&II》等其它专业课程也让马腾宇受益匪浅:“在茶园所学到的知识和技巧,对我后来的学习和科研都起到了很大的帮助。”

姚班的同学,拥有着各种不同的学习背景。但在马腾宇看来,之前的学习背景并不是关键,大家也不可能只靠以前的背景就能获得成功。“虽然刚开始也许会有些许影响,比如我自己的数学竞赛背景会让我在大一的数学课上不那么吃力。”马腾宇说,“但是从长远来说,这种影响并不是最关键的。我想大学教育的过程,其实也是让学生把之前不会的东西一点一点学会的过程。”

马腾宇记得,大一初入学时自己还不太会编程和算法,而同学杨弋是IOI的金牌,“所以我有很多不会的问题,经常会去问他;他也很热心地帮助我,同时推荐我去看《算法导论》,让我收获很大。”

马腾宇和同获“斯隆奖”的鬲融(2004年从河北省保送至清华大学计算机系,后进入“清华姚班”)也保持着很良好的关系。“我和鬲融学长还有更近的一层关系。我们博士是同一个导师,所以对我而言,他更多的是一个师兄或者说是一个mentor。我博士一年级的时候,鬲融学长是博士五年级,给了我很多帮助,也教了我很多技术。”马腾宇觉得与鬲融的交流合作十分愉快,“他是一个非常好的一个mentor,我在与他的交流合作中学到了很多东西。我们也一直保持长期合作的关系,关心的问题也比较相像。”此外,马腾宇和姚班许多同学在毕业后依旧保持着联系。而在姚班所结识的聪明又勤奋的同学,也是他一生的财富。

科研之路:上士问道,勤而行之

谈及本科期间的科研经历,马腾宇回忆,自己主要和俞华程同学一起,在孙晓明老师的指导下做了两篇关于组合数学的论文。后来在 MSRA(微软亚研院)研究学习时,在陈卫和王亚军老师的组里做了一些关于matroid algorithms的研究。

而马腾宇本人,也并不是在一开始就决心走学术的道路。“刚开始的时候,我只是想把自己的科研做好、把博士读好。到了博士四五年级的时候,我才开始考虑是要去业界工作,还是找教职。”马腾宇说,“最终还是综合考虑了自己的兴趣和实际情况,决定继续在学术的道路上走下去。”

现在,马腾宇主要做理论深度学习方面的研究。“理论深度学习的问题有很多,不只是有监督学习,也包含神经网络在无监督学习和强化学习中的使用,还有神经网络的鲁棒性等问题。”马腾宇组里的每个学生的研究也都多少有些不同,“但是大家的主线都是用在研究深度学习,或者说神经网络在不同的领域里的使用”。

对于深度学习理论与实践之间的差距,马腾宇觉得是正常的,而且这种差距也正是发展深度学习理论有趣和有意义的地方。“深度学习实践的发展速度非常快,理论如果想要很快理解所有实践中的问题,也确实有一些难度。因为我们的理论工具、数学工具可能并不完善。”马腾宇说,“但理论和实践一定程度上也是相辅相成的,在实践很成功的时候,理论可能更多地在提供解释和支撑。但是当实践遇到瓶颈时,理论反过来可能会给实践一些灵感。虽然并不是每一个理论都能有这样的效果,但是有一些理论我相信是能对实践有帮助,这也是我希望能够发展的理论。”

而马腾宇在自己的研究中,也注重理论与实践之间的关联性:“我90%的论文都有一些实验,用来证明理论是有实际的相关性的,而不是单纯的'纸上谈兵’。理论启发了新的方法,我们就用实验去测试这个方法的实际效果和潜力。我希望并且也相信也这样的理论会越来越多。”

马腾宇的博士导师 Sanjeev Arora和姚期智先生都是非常重要的计算机科学家,两位对他产生了很大的影响。在马腾宇看来,两位导师的共同点是对科研非常执着和热情。“姚先生最近还有很多单一作者的工作,我想他肯定非常忙碌,但他还在科研方面如此活跃,我十分敬佩。”有时候马腾宇回到叉院做讲座,能够看到姚先生前来,这让他感到“非常荣幸”。“我跟姚先生交流的时候,会讨论一些科研问题,可以说他对所有的前沿问题都非常关心,而且对细节也很了解,我觉得这是一种对于科研的执着。”马腾与说,“Sanjeev也是这种风格。他对关心的问题会执着地追求,当我们很难在一个研究方向上走下去的时候,他还会一直想新的思路,然后把问题做下去。”

在工作中,马腾宇会去追求一种长期效应(long term effect)。“关注long term impact主要是希望每个工作都能关注一些比较长期问题,有质量地完成,而不是简单地写写论文、发表就大功告成了。”即使论文关注的是一些比较技术性的问题,马腾宇也希望这些技术有比较广的应用。从做科研的方法上来讲也类似,“比如说在读博士的时候,多学一些技巧,多关注一些不一定直接用在科研项目上的技术。我在读博士的时候也做过挺多方向,有很多东西当时学了之后,也没有直接发论文。但是慢慢地,在后来的研究中,这些技术还是会用到的。当然,不一定说做的每件事情都能有长期的影响力,但至少这是一个值得努力的方向。”马腾宇说。

现在的马腾宇,不仅是一个学者,也是一位“师者”。马腾宇觉得,执教的经历与科研的体验“区别还是很大的”:“科研的话,目标是探索发现。教学的重点,是要让学生去理解已知的知识。已知的知识,也分熟知的结论和最新刚刚理解的新发现。教学,就是要把知识以一个最简单,或者说最符合逻辑的方法教给学生。”马腾宇当前正在执教CS229,这是非常著名的人工智能课程,“尤其CS229的学生是非常多样的,来自不同的院系,他们对于知识的理解和掌握程度也是不一样的。所以教学的体验,其实跟科研还是有很大区别的。”

祝福母校,祝福“茶园”

马腾宇感受到,过去5年到10年间,茶园的学生变得越来越强了。“我当时的简历申请放到现在,感觉可能要比很多学生差很多。所以说,我觉得清华整体上的学生实力一直在进步,这是个很好的事情。”马腾宇说,“我现在也带了很多清华的学生。没记错的话,张皓辰和董克凡都来自姚班,他们的科研也都做得很好。有一些暑期实习生,也来自姚班,做得都很不错。“

马腾宇希望学弟学妹们能够努力学习、珍惜机会,他说:“姚先生建立了这么好的一个环境,提供了这么多优质的课程,这个机会是很特殊的。姚班的声望在国际上也很高,比如我们在录取学生的时候,提起姚班,大部分的教授都是了如指掌的。”在科研和学习方面,马腾宇建议大家可以尽量把问题研究清楚,不要太急功近利:“尽管刚开始的时候,这样效率可能会低很多,但是把问题搞清楚了之后,很多事情就变简单了。”

“我非常感谢母校和茶园的培养。我已经看到清华的学生,包括科研在内所有的方面都在非常快速地进步,这是让我非常开心的一件事情。”马腾宇高兴地说,“希望清华越来越好!希望茶园越来越好!”

来源 | “清华大学交叉信息研究院”《从茶园走向世界》校友访谈系列

排版 | 赵佳

(0)

相关推荐