阿尔法折叠:对立挑战还是协同赋能
近日,人工智能再次大出风头。在CASP(国际蛋白质结构预测赛)中,谷歌旗下DeepMind团队的AlphaFold2(阿尔法折叠)摘得桂冠。在CASP的一系列测试中,AlphaFold2获得92.4分,在最具挑战的自由建模蛋白质测试中也获得87分。
一时间,AlphaFold 2“颠覆”“革命性突破”“诺奖级成果”等词汇加身。有人称其解决了“困扰生物学家50年的问题”,有人担忧“结构生物学家是否会因此失业”。
人工智能再次完胜人类,我们该欣喜还是担忧?
AI再胜人类
人体内有成千上万种不同的蛋白质,而蛋白质的功能很大程度上取决于其独特的结构。弄清楚蛋白质折叠成什么形状被称为“蛋白质折叠问题”。在过去50年中,它一直是生物学界的重大挑战。
此前,生物学家主要利用X射线晶体学或冷冻电镜等实验技术来破译蛋白质的三维结构,但这类方法耗时长、成本高。
预测蛋白质结构的CASP竞赛始于1994年,今天它已成为这一领域交流新技术的国际平台。2018年,DeepMind 团队推出 AlphaFold1 参加第13届CASP竞赛,曾取得不错的成绩。今年参赛的系统是新版本AlphaFold2,此次比赛中,AlphaFold2比第二名的成绩高出25分。
美国马里兰大学教授、CASP竞赛创始人之一约翰·蒙特认为,达到90分即可与实验方法获得的结果竞争。美国密苏里大学哥伦比亚分校讲座教授许东认为,AlphaFold2可以满足95%以上的理解功能、实验设计等需求,达到了应用的标准。
夺冠当日,DeepMind在官网发布新闻稿称,对于困扰生物学界50年的“蛋白质折叠”难题,AlphaFold2已成为业内专家认可的解决方案。《自然》新闻评论更是以《它将改变一切》为题,指出DeepMind在解决蛋白结构问题上“迈出一大步”。
算法、模型和算力
AlphaFold1参加第13届CASP竞赛后,DeepMind团队在《自然》发表文章,公开AlphaFold的代码。目前DeepMind团队还没有发表关于AlphaFold2的论文并公布相关数据,只在官网公布了相关消息就引起AI领域和生物学界的轩然大波。
“AlphaFold2的相关文章还没有看到,以我对Alpha系列的了解,应该还是集成数据驱动机器学习诸多算法的一个创新应用。”浙江大学人工智能研究所所长吴飞告诉《中国科学报》,“它相当于从包含了无穷多种答案的空间中,通过学习、优化、搜索等技术,找到一种合适的解决方法。”
吴飞举例说,比如人们产生“恐惧”这种情绪,需要找到成千上万个神经元的某种组合,形成某种神经回路结构才会在功能上产生这种情绪。人类蛋白质的组成结构非常复杂,人们要从海量的组合中,找到某种特定的组合非常困难。由于计算机的计算能力非常强大(也可以把它理解为学习模式能力和穷举搜索能力强),它能帮助人们从几亿个结构里,找到某个特定的结构,该结构能对应某个特点功能。
“这是一种大数据驱动的人工智能方法,是以深度学习和搜索组合优化相结合的整体应用。”吴飞说,“AlphaFold2的成功应该包括算法、模型、算力以及该领域已有知识,这些元素缺一不可。”
吴飞进一步解释说,AlphaFold2针对一个具体任务取得的巨大成功,所以它在模型上,肯定有一些组合式的创新。另外,DeepMind团队也收集了一批一一对应的数据(蛋白质的结构和功能一一对应的数据)。在算力上,因为要从无穷多的组合里面,找到一个对应的功能,需要对大数据中蕴含模式进行学习、对可能答案空间进行搜索,同时提高大规模计算能力,这是一次技术和能力结的合胜利。
人机协同带来飞跃
“目前主流的机器学习技术还依赖于统计学习。在数据量大,人工难以直觉分析规律的领域,相对来说人工智能具有优势。”北京航空航天大学教授李甲告诉《中国科学报》。
吴飞也强调,在某些特定领域,人工智能有人类无法企及的能力,特别是在以海量数据搜索为导向的领域。
“就像有一颗珍珠放在太平洋中,我们都知道它在,但不知道它到底在哪儿。如果人工去寻找,可能就是一项无法完成的任务。但人工智能可以凭借巨大的存储能力、超强的搜索能力和对数据高效利用的能力很容易找到它。”吴飞说。
2016年,DeepMind团队的AlphaGo(阿尔法狗)战胜围棋大师李世石,曾掀起AI界和围棋界的滔天巨浪,AlphaGo也在很大程度上改变了人们对AI的认知。
在围棋比赛中,每一步都有一个“最优落子”的选择,人类不可能在大脑里把几十亿个落子情况都推演一遍,但是计算机就有这样的能力。
“AlphaFold2和之前的AlphaGo类似,是机器学习模型的进步和算力的提升,以及‘标签数据’指导下完成的任务。”吴飞说,“即使在某些特定领域,也不能说是‘人工智能超越了人类’,而应该叫做‘人机协同完成’。”
吴飞认为,人工智能的这种成功是一种‘模式学习和模式匹配’能力。比如,我们经常用到的人脸支付,人工智能不是‘识别’出你的脸,它是从几十万张人脸数据中,找到和你匹配的人脸模式。比如,它发现相似度超过90%,就认为是你。
“但你如果问人工智能,‘为什么认为这张脸是我?’人工智能就是有嘴也解释不清。”吴飞说,“所以它(人工智能)是某些领域中非常好的一个工具,可以在某项任务中节省大批人力、节省大量时间,但对这个结果的利用,还要依靠人类专家来完成。如果将这种工具和人的特长结合,协同赋能就能加快创新,带来科学上的飞跃。”(张双虎)
来源: 中国科学报