西湖大学郭天南:AI赋能蛋白质组驱动的精准医学
世界科技青年论坛暨“35 岁以下科技创新 35 人”(TR35)全球-亚太区线下发布仪式,已于 10 月 28 日至 29 日,在杭州未来科技城成功举办。该论坛由杭州未来科技城(海创园)管委会指导,DeepTech 主办。
会议期间,青年科学家、科技创业人士探讨了如何让科学技术造福于人类未来等问题。
西湖大学生命科学学院特聘研究员、西湖实验室 iMarker 核心实验室主任郭天南介绍了如何通过 AI 分析蛋白质组大数据,进而掌握疾病发生发展的规律,以及探索治疗新方法。
图 | 郭天南
每个人都很关注健康。尤其现在新冠疫情期间,为了避免感染病毒,大家需要佩戴口罩,时不时还要去做核酸检测。
疾病的检测非常强调数据和 AI,而数据又是 AI 的基础。
数据包括心跳、脉搏等各种体征、CT、显微镜放大的组织等各种医学图像等等。然而,还有一个我们看不到的微观世界——细胞里面分子世界,它们决定着人到底有没有生病,生病了该用什么药物来治疗。
郭天南说,细胞里面有无数的蛋白质机器,处于动态运作之中。这个蛋白质的世界在科学上叫“蛋白质组”,如果能够通过技术对蛋白质组的即时状态进行测量,那我们将有可能掌握疾病发生、发展的规律,以及探索更加有效的治疗方法。
他还提到,分析人的临床样品的蛋白质组学叫临床蛋白质组学。现在有各种各样的技术可以分析来源于人体的样品。体液、血液、尿液、眼泪、组织、肿瘤细胞,甚至像头发、指甲、粪便等都含有大量的蛋白质,而这些蛋白质处于动态变化中,指示着当前人体的健康状态和疾病进展情况。
“几乎所有的药物都是针对蛋白质,但是蛋白质组的检测在临床中目前应用仍然不多。因为只有很少的实验室才有能力分析蛋白质组。”郭天南说道,“对蛋白质进行分析需要用到非常昂贵的设备。在美国,设备一个小时的使用费大约 500 美元。2006 年,分析一个蛋白质大概需要 3 美元;在 2020 年,价格已经降到 0.1 美元以下。而在中国,实际上可以以更低的价格对蛋白质组进行检测。”
价格的降低,意味着可以大量地对来源于人体或者自然环境中的植物、微生物的蛋白质进行分析,这样就能对我们之前无法测量的蛋白质组微观世界有一个更直接、更全面的认识。
蛋白质组到底是什么样子的?在数据上如何呈现呢?
(来源:郭天南)
“我们有一个数据格式,在特殊的软件里蛋白质的数据会变成多维的矩阵。它可以转化为视频或图像,如图中所展示的,每一个像素点就是细胞中一个蛋白质的一个多肽的片段。”郭天南介绍说。
他还说,如果随机抽一滴血或者一滴眼泪,进行 45 分钟的质谱分析,可以产生超过一百亿个像素点。而这反映了当前样品里蛋白质组的即时状态。
据了解,如今,可以用 AI 对临床样品中不同时间的蛋白质组形成的大数据进行分析。
郭天南用两个例子做了说明。
新冠肺炎的临床诊断
第一个是有关新冠肺炎的诊断。他说,感染新冠病毒的患者大约 80% 是轻症,轻症患者通过一般的抗病毒治疗,甚至是通过自身免疫抵抗就能转阴。
然而,还有 20% 的患者是重症或者危症。跟轻症患者类似的是,重症/危症患者一开始也是发热、咳嗽,但是如果几天内不进行治疗,会在极短时间内变得呼吸困难,需要使用呼吸机吸氧。而当发展到重症的时候,临床上就很难治疗了。
那有没有什么办法能提前将重症患者从轻症患者里面筛选出来呢?
郭天南说,虽然患者早期表现的一些症状一样,但是血液里的蛋白质也许是不一样的。“在进行了详细的临床研究之后,我们开发了一种方法。通过蛋白质组和代谢组的分析,建立了机器学习模型,开发一个模型判断轻重症,然后用独立的病人做验证,可以非常准确地对轻症和重症患者进行鉴定,甚至是提前鉴定。”
他还提到,在研究中有一些非常特殊的病例。比如,有一个患者是重症,但他们的模型却认为是轻症。后来临床资料的审核发现这个患者虽然入院的时候症状表现得很严重,但是已做了 20 多天的各种抗病毒的治疗,其分子状态更接近于轻症,后面果然顺利出院了。
还有一个患者临床诊断是轻症,但是模型认为是重症。最后,此患者的住院时间是所有病人里面最久的,50 多天后还没转为阴性,临床上找不到原因,分子模型给出提示。
郭天南还说了其他一些患者的例子,包括对一位高血糖危相患者的预测。
他说:“我们对蛋白质的研究,已经处于不错的水平。最近,我们还开发了新的技术,通过尿液的蛋白质检测,建立 AI 模型,对新冠轻重症进行分类。”据了解,这项尿液研究得到了 AEPC 和中国科技部的支持。郭天南表示,他们会在多个 APEC 经济体开展多中心的临床试验,以推广通过尿液判断新冠轻重症的方法。
他还说:“我们还有一些项目,比如通过眼泪进行疾病的诊断和分析。”
甲状腺结节的诊断
郭天南举的第二个例子,说的是甲状腺结节。
他说,甲状腺虽然是较小的器官,但它一般被认为是人体的“CEO”,其会接受来自大脑的激素信息,并将信息传递到人体的五脏六腑,并且影响我们的情绪和肌肉的力量等。
甲状腺结节非常常见。据统计,每两个成年人中就可能有一个人患有甲状腺结节。
如果甲状腺结节是恶性的,通常需要把甲状腺切掉。甲状腺全部切掉之后,患者一般要终身服药以补充激素。
郭天南提到,在做甲状腺结节的检查时,会有一个盲区。一般情况下,做 B 超或血液检查可以判断其是良性还是恶性,如果还不能判断就再做一个穿刺检测。但是临床上还有 30% 的甲状腺结节患者,没有任何的技术可以准确判断他们的肿瘤到底是良性还是恶性。
对此该如何解决?郭天南说:“我认识一个新加坡资深的甲状腺外科医生,他会跟这样的患者说你的肿瘤有 80% 的可能性是良性,可以回去观察,不需要做手术。但是,他说如果科室比较年轻的医生可能会对病人说,你的肿瘤有 20% 的可能性是恶性,最好切掉,这样就不会有患甲状腺癌的风险。”
郭天南说,这实际上是临床上一个非常棘手的问题,只有通过精准的诊断才能做出正确合理的判断。到底切还是不切?“我们可以从极其微小的、甚至肉眼很难看到的石蜡组织中测量出数以千计的蛋白。通过建立人工智能的模型,结合多中心的临床实验,建立神经网络模型,对甲状腺结节的良恶性判断达到 90% 左右的综合准确度,这是其他方法无法达到的。”
他最后说道:“我们正在致力于让研究的成果变成可以在真实世界中给患者提供服务的产品,这是我们团队努力的方向。”
-End-