个性化癌症治疗再进一步!科学家通过图卷积神经网络技术发现165个新的致癌基因 2024-06-04 01:36:33 作者:刘芳 编审:王新凯、寇建超排版:王落尘作为对人类健康造成最重大威胁的疾病之一,癌症一直是各国科学家们重点研究的对象。据世界卫生组织国际癌症研究署(IAR)发布的全球最新癌症预估数据显示,2020 年全球新发癌症病例 1929 万例,死亡病例 996 万例。其中,中国新发癌症 457 万人,占全球 23.7%,癌症新发人数远超世界其他国家。因此,寻找癌症预防和治疗的有效手段,已成为前沿科技的主要方向。近日,德国柏林马克斯・普朗克分子遗传学研究所(MPIMG)联合慕尼黑亥姆霍兹联合研究中心计算机生物学研究所(ICB),开发了一款名为 “EMOGI” 的机器学习算法 ——“可解释的多基因组图像集成”(Explainable Multi-Omics Graph Integration)。EMOGI 算法利用病人样本数据和图卷积神经网络(GCN)技术,可以在细胞突变之前对致癌基因进行识别。最终,科学家们利用该算法成功识别出了 165 个新的致癌基因,这将为开发个性化靶向抗癌药,揪出癌症背后的 “真凶” 带来重要契机。相关研究以 “Integration of multiomics data with graph convolutional networks to identify new cancer genes and their associated molecular mechanisms” 为题,于 4 月 12 日发表在科学期刊《自然-机器智能》(Nature Machine Intelligence)上。 (来源:Nature Machine Intelligence)解开癌症之谜:基因组分析在癌症发生过程中,肿瘤细胞会失去控制。它们不断疯狂增殖并进入组织,破坏器官,从而损害基本的生命功能。目前人们对癌症的病因尚未完全了解。但从分子生物学的角度来说,癌变意味着由一连串 DNA 受损而引发的细胞分裂速率失控。当调控细胞生长的基因发生突变或损坏时,细胞便开始了持续的、不受控制的生长及分裂。因此,对癌症进行基因组分析便成为了解开癌症之谜、找到治疗方法的关键。在最新的研究中,科学家们用机器学习算法分析了上万个从病人样本中生成的数据集。这些数据集包含了体细胞变异及胚系变异、基因拷贝数变异、DNA 甲基化、基因表达和蛋白质交互作用(PPI)等信息。细胞培养实验表明,最新发现的 165 个致癌基因与已知的癌症基因相互作用,且对肿瘤细胞的生存来说必不可少。 (来源:Pixabay)对此,MPIMG 研究小组负责人 Annalisa Marsico 表示:“只有知道致病原因,我们才能对其进行有效纠正。这就是为什么发现尽可能多的致癌机制是如此重要。在理想情况下,我们终有一天可以获得癌症基因组的全貌。对不同患者来说,癌症基因组对病情的进展有着不同的影响,这也是个性化癌症治疗方案的基础。”追踪隐秘致癌基因与化疗等传统治疗方法不同,个性化治疗方案强调根据肿瘤类型量身定做精准药物。近年来,通过基因组数据分析来精确预测每个肿瘤的复杂性、进而开发出适合临床环境的个性化治疗手段已经成为最新研究趋势。Annalisa Marsico 解释说:“我们的目标是能够为每个患者都选择最好的治疗方法,也就是副作用最少、最有效的治疗方法。此外,我们将可以根据癌症的分子特征来识别已经处于早期阶段的癌症。”虽然个性化靶向药为患者们带来了希望,但以往的研究存在着一定缺陷。2016 年,Ian F. Tannock 和 John A. Hickman 曾在《新英格兰医学杂志》(NEJM)撰文指出,即使在单个肿瘤中,癌细胞的基因组成在不同区域之间也存在显著差异,这就是困扰科学家们的肿瘤异质性。肿瘤异质性是指肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出分子生物学或基因方面的改变,从而使肿瘤的生长速度、侵袭能力、对药物的敏感性以及预后等各方面产生差异。即使是同一位癌症患者,肿瘤细胞也会根据处于身体的不同位置而发生变化(肿瘤间异质性),甚至同一肿瘤内的肿瘤细胞也有细微甚至显著不同(肿瘤内异质性)。癌症治疗的一个主要挑战,就是并非肿瘤内的所有细胞都对大多数治疗方法具有同等的敏感性或者有效的靶向性。而未被消除的癌细胞往往成为癌症复发的关键驱动因素。可以说在很大程度上,就是肿瘤异质性在 “从中作祟”。 (来源:NEJM)对于上述研究,此次研究的论文作者之一 Roman Schulte-Sasse 表示认同:“到目前为止,大多数研究都集中在基因序列的致病性变化,即细胞蓝图(blueprint of the cell)上。但是,近些年的研究已经证明,表观遗传干扰或基因活性失调也可能导致癌症。” 这就是为什么在此次研究中, 科学家们将反映蓝图中故障的基因序列数据与代表细胞内事件的信息合并在一起。Schulte-Sasse 说:“我们发现了一些在肿瘤中序列几乎没有变化但又不可或缺的基因,因为它们为肿瘤调节能量供应。这些基因通过其他方式(化学)失控,例如 DNA 甲基化。这些(化学)变化使基因序列信息保持不变,却控制了基因的活动。因此,这类基因很有希望成为靶向药的新靶点。由于它们在后台运作,我们只能通过复杂的算法才能找到它们。”说到这里,就不得不提到机器学习领域中大名鼎鼎的图卷积神经网络技术。这个概念首次提出于 ICLR2017(成文于 2016 年),作为被设计用来针对图结构的神经网络,它能够利用图的信息,从之前的网络层中聚合信息的,同时在图中这种机制能够对节点产生有用的特征表示。正是因为采用了这种全新的技术和思维模式,科学家们才能在基因序列没有改变的情况下发现这 165 个基因与已知致癌基因的联系和其在蛋白质交互作用中的功能。而这使得有致癌基因名录上增加了 165 个新条目,至此,人类所认知的致癌基因已经达到了 700-1000 个。只有通过生物信息学分析和最新的 AI 算法相结合,研究人员才能追踪到隐藏的基因。Schulte-Sasse 说:“蛋白质交互作用可以被绘制成一个数学网络,也就是图形。你可以把它想象成一个铁路网,每个车站都对应着一个蛋白质或基因,它们之间的每一个相互作用都可以用列车连接。”在图卷积神经网络技术的帮助下,研究人员甚至能够发现那些以前没有被注意到的列车链接。这次的研究共分析了 16 种不同肿瘤类型,上万个不同数据网络图,而每个图内包含了 12000-19000 个数据点。此外,Annalisa Marsico 也强调,EMOGI 算法并不局限于预测癌症,数据中显然隐藏着更多有趣的细节。从理论上讲,它可以用来整合不同的生物数据集,并找到规律和模式。“将我们的算法应用于类似的有大量数据且和基因关系密切的复杂疾病可能会很有用。例如,糖尿病等复杂的代谢性疾病等。”参考资料:https://www.nature.com/articles/s42256-021-00325-yhttps://en.wikipedia.org/wiki/Protein% E2%80%93protein_interactionhttps://www.molgen.mpg.de/4385539/news_publication_16712193_transferred?c=228720https://www.nejm.org/doi/full/10.1056/NEJMsb1607705 学术头条-生命科学读者交流群来啦! 为了给大家带来更优质的体验 本群采取实名验证入群 欢迎生命科学、医学相关话题的讨论、交流和分享 重点!!! 赞 (0) 相关推荐 综述 | Frontiers in Oncology : 不断变化的RNA测序技术及其在临床肿瘤学中的应用(国人作品) 编译:夕夕,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 RNA测序(RNAseq)是生命科学领域最常用的技术之一,已广泛用于癌症研究,药物开发以及癌症诊断和预后.在各种生物学和技术问题的推动 ... 『珍藏版』Nature Reviews Genetics综述 | 深度解析肿瘤异质性 近期,英国 Francis Crick研究所Charles Swanton与伦敦玛丽女王大学Trevor Graham合作在Nature Reviews Genetics杂志上发表了综述文章Resol ... 诺奖技术CRISPR:抗癌再添新招 | Nature子刊最新成果 CRISPR/Cas9是一项革命性的基因编辑技术,刚刚摘得2020年诺贝尔化学奖.利用这一技术,研究者们能够靶向基因组中的特定序列,剪切和粘贴DNA片段,以可控的方式修改基因组.这一新型基因编辑工具被 ... 图卷积神经网络用于解决小规模反应预测 文章来源于微信公众号 智药邦(ID:PHAIMUS) 今天给大家介绍的是浙江工业大学智能制药研究院的段宏亮教授研究团队发表在Chemical Communications上的文章 " A g ... 玛雅人是外星文明?科学家在图卢姆水洞发现蛛丝马迹,令人意外 大约3500多年前,在美洲的热带雨林之中,也就是如今墨西哥(东南部).犹加敦半岛.巴拿马.危地马拉和洪都拉斯等地,出现了一个神秘的古文明,它就是玛雅文明. 打开凤凰新闻,查看更多高清图片 早知道,在美 ... 中科院计算所沈华伟:图卷积神经网络的思想起源 智源社区 & AI科技评论 作者 | 周寅张皓 小到分子相互作用,物质结构,大至气候变化,星系模型,很多自然界和社会生活中的现象都能用图结构描述.而如何将神经网络应用到图网络中进行计算,在几年 ... 斯坦福大学最新论文|知识图卷积神经网络在推荐系统中的应用 推荐系统广泛应用于互联网应用和服务中.传统的协同过滤推荐算法通常会遇到用户-物品交互的稀疏性问题和冷启动问题,可以通过引入额外的信息来解决,如用户/物品属性信息和社交网络.近年来,为了解决上述问题,一 ... 图卷积神经网络理论基础 您想知道的人工智能干货,第一时间送达 Graph Convolutional Networks图卷积网络涉及到两个重要的概念,Graph和Convolution.传统的卷积主要应用于Euclidean ... JCIM|基于图卷积神经网络的逆合成反应预测和可解释性可视化 今天给大家介绍的是Journal of Chemical Information and Modeling上的文章 "Prediction and Interpretable Visuali ... 科学家在人的喉咙深处,发现未知的新器官,人体秘密还有很多 科学家在人的喉咙深处,发现未知的新器官,人体秘密还有很多 华人科学家从原子级别破解DNA如何修复,癌症治疗又有新可能 ▎药明康德内容团队编辑 人体基因组含有的约31.6亿个DNA碱基对存储着生物体赖以生存和繁衍的遗传信息,因此维护DNA分子的完整性对细胞至关紧要.DNA指导身体里各细胞如何运作,当DNA发生损伤或被摧 ... 精准治疗癌症,深圳科学家开发出“糖衣炮弹”疗法 在人类和肿瘤的漫长对抗中,手术.化疗.放疗成为常见治疗手段.在杀死肿瘤细胞的同时,这些方法也会"误伤"正常细胞,脱发.心脏毒性等副作用就是这么来的. 如何让治疗手段精准面向肿瘤细胞 ...