开发解释肠内细菌丛复杂脂质多样性的方法 - -成功鉴定肠内细菌产生的新型脂质-

开发解释肠内细菌丛复杂脂质多样性的方法 - -成功鉴定肠内细菌产生的新型脂质-

理化学研究所(理研)生命医科学研究中心代谢综合征研究小组的有田诚小组组长、冈桥伸幸客座研究员、安田柊研修生(研究当时)等的研究小组提出了能够进行包括未知代谢物在内的全面分析的无靶质谱法[1], 通过结合支持未知分子结构推测的Molecular spectrum networking[2]技术,开发了一种新的类脂体分析[3]方法,来解释肠道菌群所产生的复杂脂质多样性。 本研究成果可望对阐明肠内细菌丛和宿主的相互作用形成的复杂脂质代谢网络,以及发现与宿主机体稳态和疾病发病相关的新功能性代谢物做出贡献。 这次,研究小组对小鼠的粪便试样应用了能够包括未知分子在内进行全面测量的无靶质谱法。 针对约6,100个大规模光谱数据,应用聚类结构相似分子的分子光谱网络技术,成功地确定了具有相似结构的分子群,使需要进行结构分析的对象迅速可视化。 另外,从现有数据库中发现了未收录的新肠内细菌脂质acyl alpha-hydroxy fatty acid ( aah fa ),推测了与其产生相关的细菌。 本研究刊登在科学杂志《iScience》( 2020年12月18日刊登)和《STAR Protocols》在线版( 2021年4月23日)上。

采用非靶向类毒素技术明确小鼠肠道菌群与脂质的关系

背景 哺乳类肠道内栖息着数千种共生细菌。 肠道细菌与哺乳类有不同的代谢途径,认为它们产生的独特代谢物与宿主机体稳态的维持和疾病的发病有关。 特别是在复盖菌体表层的脂质成分中,已知有许多通过宿主的模式识别受体[4]引起炎症的分子。 这些脂质中,根据碳链的长度、双键的位置、立体结构等的不同,存在数万到数十万种多样的分子种类,其结构上的差异左右着与受体的亲和性。 由于这种结构的特殊性和多样性,迄今为止还未能捕捉到肠内细菌丛形成的脂质的整体情况。

研究方法和成果 研究小组以老鼠的肠内细菌为对象,通过质量分析实施了无靶点类毒素注射1 )。 过去,专门用于检测特定分子的靶向分析[5]已被广泛使用,而非靶向分析[5]不需要预先限定分析对象,适合捕捉肠道菌群产生的未知分子。 首先,用液相色谱四极飞行时间型质谱分析装置( LC-QTOF/MS ) [6]分析了从小鼠粪便中提取的总脂质,取得了包括未知分子在内的约6,100个综合性MS/MS光谱[7]数据。 利用现有的数据库,尝试鉴别这些分子,结果有90%的人无法鉴别。 这意味着许多未鉴定的分子是由肠道细菌产生的。 为了从其中高效鉴定肠内细菌产生的脂质,相似结构的脂质分子显示相似的MS/MS光谱的性质备受瞩目,将以往用于天然产物结构分析的Molecular spectrum networking技术应用于类脂体数据。 该方法计算用LC-QTOF/MS取得的任意两个MS/MS光谱间的相似度,通过制作将表现出高相似性的离子之间用线连接的网络,将脂质分子群的整体情况可视化(图1 )。

根据图1 MS/MS光谱推测化学结构

(上)以往的MS/MS解读工作。 迄今为止,通过人眼逐个观察长达数千个的MS/MS光谱来进行结构推测,但这需要熟练的经验和庞大的时间。 (下) molecular spectrum网络技术概述。 由于该方法在进行结构估算之前,可以事先将具有相似MS/MS光谱的离子进行汇总,因此可以一次吊起结构相似体,从而实现高效的结构估算。

这样,即使在结构未知的情况下,也可以对表示相似MS/MS光谱的离子进行分类。 通过应用该方法,发现了多个推测由结构相似分子组成的团簇(图2 )。 接着,通过综合该数据对因服用抗生素鸡尾酒而杀死肠道细菌的小鼠粪便的分析结果,炙出了与肠道细菌产生相关的脂质。 由于强烈暗示了通过投用抗生素而减少量的离子是来自肠内细菌的代谢物,因此可以作为应该优先进行结构分析的对象进行筛选。 解读这些MS/MS光谱,发现含有醚键的甘油脂质[8]、极性头部具有磷乙醇胺和肌醇等修饰的鞘脂类[9]、碳-硫原子直接键合的磺基磷脂[10]、脂肪酸为氨基酸,

图2小鼠粪便中脂质的摩尔光谱网络的结果

表示检测出各个圆圈的脂质分子种类,用线将MS/MS光谱类似的物质之间连接起来。 并且,用下三角标记表示因服用抗生素而检测量减少到十分之一以下的物质时,发现它们形成了独立的簇(被黑虚线包围的部分)。 推测这些结构(椭圆内)的结果表明,含有宿主代谢酶不能产生的独特的脂质。 另外,从其中,可以推测醋酸、丙酸、丁酸等短链脂肪酸[12]与α位具有羟基的极长链脂肪酸[12]进行了酯键的化合物,是一种非常独特的新型脂质acyl alpha-hydroxy fatty acid ( aydroxy fatty acid 并实际进行了有机合成,证明了其估算结构是正确的(图3 )。

图3新型肠道细菌脂质AAHFA的MS/MS光谱和分子结构

上) AAHFA的估计结构。 通过解读从粪便样本中检测出的MS/MS光谱,推测其具有碳原子数为4的短链脂肪酸与碳原子数为2~4的极长链脂肪酸的α位羟基酯键的独特结构。 (下)粪便样品中aah-fa和有机合成aah-fa的MS/MS光谱的比较。 粪便样本中的AAHFA与化学合成的AAHFA的MS/MS光谱非常一致,证实了AAHFA的结构与推测的一致。

并且,为了推测这次发现的与产生肠内细菌依存性变动的脂质相关的细菌种类,向其他老鼠提供了只杀灭特定菌群的各种抗生素,制作了肠内细菌丛中有变化的老鼠。 在该小鼠粪便中应用非靶标质谱和16S rRNA序列分析[13],进行脂质分子和细菌种类的相关分析,表明此次发现的脂质群分别与特定菌种群呈正相关(图4 )。

图4显示肠内细菌依赖性的脂质分子种类和菌种的相关性

对通过施用各种抗生素使肠道菌群发生变化的多只小鼠粪便样品进行分析,并对脂质分子种类和菌种量进行了相关分析。 不同颜色的色条分别表示不同的脂质等级(纵)和菌群(横),●(黑点)表示特别显着的相关性( p值< 0.0001 )。 明确了肠内细菌依存性产生的脂质分子种类与特定的菌群呈明显的正相关,成功推测了与这些脂质的产生相关的菌种。

注1 ) 2020年6月16日新闻发布会“阐明生命的脂质多样性”﹝见下﹞

今后的期待 在这次的研究中,明确了通过非靶标质谱法和Molecular spectrum networking技术相结合,肠内细菌产生了结构复杂的脂质。 可以认为,正确捕捉这种在以往的靶向分析中忽略的分子群,将有助于理解癌症、肥胖、过敏等各种疾病中变动的细菌种类的意义。 本研究开发的方法是一种可以将这样的菌丛变化作为脂质的量和质的变化进行俯瞰捕捉的技术,期待有助于确定支配肠内细菌所涉及的生命现象的功能性执行因子。

补充说明 1 .质谱法 将物质离子化,通过检测其离子来测量分析对象质量的分析法。 离子的量与试样中测定对象的量对应。 将分析对象离子化后,加入能量使离子碎片化,利用检测这些离子的串联式质谱分析装置,还可以推测分析对象的化学结构。 2 .模块频谱网络 计算两个MS/MS光谱之间的相似度,制作将显示一定以上相似性的离子之间连接的网络的质谱分析数据的信息科学分析方法。 3 .类脂分析 是全面测量脂质种类总体(类脂体)的分析方法。 4 .模式识别受体 它是一种激活自然免疫系统的受体,可以迅速感知并排除侵入机体的外部,认识微生物所具有的共同分子结构。 5 .目标分析、非目标分析 靶分析是预先用质谱分析装置指定要测量的离子,将其高灵敏度且高通量地测量的测量法,被广泛应用。 另一方面,由于没有测量关注对象以外的对象,所以孕育着忽略未设想分子的风险,因此预先不限定对象的非目标分析备受关注。 虽然非目标分析可以进行综合测量,但是大规模数据的分析变得复杂。 6 .液相色谱四极飞行时间型质谱分析装置( LC-QTOF/MS ) 将作为串联型质量分析装置的一种的四极飞行时间型质量分析装置与液相色谱相结合的分析装置。 用色谱法根据物性的不同分离分子后,将它们导入质谱分析装置进行离子化。 擅长于同时获取分析对象离子的量及其片段信息的分析模式,在进行非靶标分析时被广泛使用。 7 .毫秒/毫秒频谱 用串联质谱分析仪选择特定的离子后,测量碎片化产生的离子群的光谱。 严格来说叫做产品离子光谱。 8 .甘油脂质 在活体中看到的代表性脂质等级。 通常采取脂肪酸与甘油分子酯键结合的结构。 9 .鞘脂类 与甘油脂质齐名的代表性脂质等级。 呈鞘氨醇碱基和脂肪酸酰胺结合的结构,通常哺乳类的极性头部结合有糖和磷胆碱。 10 .磺酰氯 与神经醯脂质相似,但神经醯碱部分是硫原子被直接与碳原子结合的类生物碱置换的结构的分子群。 11.N -酰胺 脂肪酸的羧基与甘氨酸、丝氨酸、鸟氨酸等酰胺结合而成的分子群。 12 .短链脂肪酸、极长链脂肪酸 根据脂肪酸链长的分类,大致将碳原子数6以下称为短链脂肪酸,将20以上称为极长链脂肪酸。 13.16S rRNA序列分析 一种分析方法,通过解读用于生物系统分类的16S rRNA基因序列,与数据库上已知的细菌序列进行比较,从而调查样品中存在的细菌。

研究小组 理化学研究所生命医生科学研究中心 代谢综合征研究小组 队长有田诚 (庆应义塾大学药学院代谢生理化学讲座教授) (横滨市立大学研究生院生命医科学研究科研究生院客座教授) 客座研究员冈桥伸幸 (大阪大学研究生院信息科学研究科副教授) 研修生(研究当时)安田柊 (北里大学药学院卫生化学教室助教) 研究员(研究当时)津川裕司 (理研环境资源科学研究中心元细胞信息研究小组研究员(研究当时) ) (东京农工大学研究生院全球创新研究院副教授) 客座研究员池田和贵 (和式DNA研究所) 客座研究员上田政宏 ( JSR株式会社) 微型生物研究小组 小组组长(研究当时)服部正平(服部正平) 副队队长须田亘 绪方勇亮

研究小组 理化学研究所生命医生科学研究中心 代谢综合征研究小组 队长有田诚 (庆应义塾大学药学院代谢生理化学讲座教授) (横滨市立大学研究生院生命医科学研究科研究生院客座教授) 客座研究员冈桥伸幸 (大阪大学研究生院信息科学研究科副教授) 研修生(研究当时)安田柊 (北里大学药学院卫生化学教室助教) 研究员(研究当时)津川裕司 (理研环境资源科学研究中心元细胞信息研究小组研究员(研究当时) ) (东京农工大学研究生院全球创新研究院副教授) 客座研究员池田和贵 (和式DNA研究所) 客座研究员上田政宏 ( JSR株式会社) 微型生物研究小组 小组组长(研究当时)服部正平(服部正平) 副队队长须田亘 绪方勇亮

研究支援 本研究包括:日本学术振兴会( JSPS )科学研究费补助金新学术领域研究(研究领域提案型)“脂质质量揭示的生命现象(领域代表者:有田诚)”、该基础研究( b )“基于有助于综合信息学的新代谢控制机制的阐明(研究代表者:津诚) 是在日本医疗研究开发机构革新性尖端研究开发支援事业孵育类型( AMED-LEAP )“使用肠内细菌株鸡尾酒创造新医药品(研究开发代表者:本田贤也)”的支援下进行的。

原論文情報

  • Shu Yasuda, Nobuyuki Okahashi, Hiroshi Tsugawa, Yusuke Ogata, Kazutaka Ikeda, Wataru Suda, Hiroyuki Arai, Masahira Hattori & Makoto Arita, "Elucidation of gut microbiota-associated lipids using LC-MS/MS and 16S rRNA sequence analyses", iScience, 10.1016/j.isci.2020.101841

  • Nobuyuki Okahashi, Masahiro Ueda, Shu Yasuda, Hiroshi Tsugawa & Makoto Arita, "Global profiling of gut microbiota-associated lipid metabolites in antibiotic-treated mice by LC-MS/MS-based analyses", STAR Protocols, 10.1016/j.xpro.2021.100492

  • Shu Yasuda,Nobuyuki Okahashi,Hiroshi Tsugawa,Yusuke Ogata,Kazutaka Ikeda,Wataru Suda,Hiroyuki Arai,Masahira服部哲和Makoto Arita,“用液相色谱-质谱/质谱和16S rRNA序列分析阐明肠道微生物群相关脂质”,国际科学杂志,10.1016/j.isci.2020.101841新規タブで開きます 冈桥信行,上田正弘,舒安田,对川博司和真由太郎,“通过液相色谱-质谱/质谱分析对抗生素治疗的小鼠肠道微生物群相关脂质代谢物的全球分析”,STAR Protocols,10.1016/j . xpro。20021.002000000004新規タブで開きます

    发表者 物理化学研究所 生命医学科学研究中心代谢综合征研究小组 队长有田诚 客座研究员冈桥伸幸 研修生(研究当时)安田柊

      阐明生命的脂质多样性 - -通过质谱信息学为理解复杂的生命现象做出贡献-

        理化学研究所(理研)生命医生科学研究中心代谢综合征研究小组的津川裕司研究员(环境资源科学研究中心代谢综合征信息研究小组研究员)、有田诚小组组长(庆应义塾大学药学部教授)等国际联合研究小组为了明确生命活动所需分子脂质的结构多样性而进行了创新 本研究成果能够准确地捕捉构成生物体的脂质的“质”(脂肪质量[2] )的差异,期待为理解生命科学研究的各个领域中复杂的生命现象做出贡献。 近年来,利用质谱分析法[3]捕捉脂质结构多样性的研究十分盛行。 但是,质谱大数据复杂且庞大,而且很难通过MS/MS光谱[4]全面阐明脂质结构,因此其全貌几乎尚不清楚。 这次,联合研究小组为了全面捕捉人和小鼠的内脏器官·组织细胞、肠内细菌丛等脂质成分,利用最先进的质谱分析方法进行了非靶向分析[1]。 开发用于分析得到的质量分析大数据的信息处理技术(质量分析信息学)的结果表明,与现有研究相比,存在约10倍以上的约8,000种脂质分子结构,可以捕捉脂质结构的多样性。 本研究刊登在科学杂志《Nature Biotechnology》在线版( 6月15日:日本时间6月16日)上。 -

      用质量分析信息科学分析脂质种类(左),全面捕捉(中央)生物组织中的质量

        背景 为了承担生命系统的各种功能,生物体内存在多种脂质分子种类,其多样性被认为与各种生命现象和功能控制有关。 例如,已知被分类为作为细胞膜主要构成成分的磷脂之一的磷脂酰胆碱( PC )的脂质等级中,大约有1,500种结构多样性(图1 )。 这是因为构成PC的脂肪酸组合的多样性。 脂肪酸除了饱和脂肪酸(棕榈酸和硬脂酸)、不饱和脂肪酸(油酸等)之外,还有多元不饱和脂肪酸(花生四烯酸、二十碳五烯酸、二十二碳六烯酸)等多种。 PC最多结合有两个酰基(脂肪酸),根据其组合可以采用各种各样的结构(图1 )。

            图1脂质分子的概略
            细胞被称为“脂双层膜”的脂质膜所包裹,作为其构成成分的脂质分子通过极性基团和脂肪酸以及连接它们的结合部的组合,维持着多样性和生命系统(左图)。 棕榈酸(碳原子数16,双键数0 :绿线)和亚油酸(碳原子数18,双键数2 :蓝线)与构成细胞膜的主要脂质等级之一磷脂酰胆碱( PC )结合的具体结构如右图所示。

          另外,已知根据结构特性分类的脂质等级(子类)有301种,包括预测结构在内,估计该生物界存在超过4万种的脂质(图2 )。 如果着眼于这些各种脂质结构的质量差异,也就是脂质的多样性,能够弄清其多样性和平衡的生物学意义,就有望理解至今尚未查明的复杂的生命现象。

        图2脂质结构的多样性

          脂质分子种类大致分为8个类别,作为根据极性基团和功能等进行分类的子类定义了301脂质类(左图)。 来自脂质研究者在国际上维持的LIPID MAPS数据库)。 右图中显示了8个类别的名称以及登记在各个类别中的分子种类的数量。 迄今为止的生物化学研究中被确认存在的脂质有2万种,包括预测结构在内的总数超过4万种,但是综合捕捉这些的方法还没有确立。

            另一方面,为了利用近年来取得惊人进步的质量分析技术来捕捉脂质结构的多样性,世界各地的研究正在进行。 但是,由质谱分析装置得到的大数据复杂且庞大,而且根据得到的MS/MS光谱很难全面解释脂质结构,因此其多样性的全貌几乎尚不清楚。 因此,联合研究小组尝试构建了能够广泛、明确地识别这种脂质多样性,凸显出各自质量差异的全面性脂质分子分析基础。

              研究方法和成果 为了全面掌握脂质的多样性,液相色谱-串联质谱分析( LC-MS/MS ) [5]或离子移动性-串联质谱分析( IM-MS/MS ) [6]得到了广泛使用。 另外,脂质的分子结构通过读取脂质特有的MS/MS光谱来解释(图3 )。

              图3质谱数据的概要、脂质结构和MS/MS谱的关系

                实际的LC-MS/MS数据为三维数据,包括脂质分子种类的溶出时间(保持时间)、质量信息( m/z )、代谢物的存在量(离子强度)。 而且,被称为峰的山一样的东西一个一个对应着各脂质分子种类。 各峰在质谱分析装置内的碰撞室的地方通过被称为“质谱”的方法被碎片化,以MS/MS光谱的形式观测到化合物的碎片化结构(左上图)。 通过全面地进行读取这些碎片化离子的信息,推测脂质代谢物结构的工序(右上图),可以得到全面的脂质分子信息。
                该研究小组首先将“脂质的分子结构和MS/MS光谱的关联性”公式化,着手开发用于从MS/MS光谱全面推测脂质结构的算法。 也就是说,解读各脂质等级特有的“质量分段模式”,用编程技术表现了无论含有哪种类型的脂肪酸都成立的分段机制。 最终,建立了一种算法,在目前定义的全部301个脂类中,包括未报告的新结构在内,共计117个脂类。 这个数量比世界上公开的任何程序都涵盖了更广的分子种类,可以捕捉到比以往大约两倍的脂质等级。 另外,作为决定化合物结构的基准,重要的参数有LC-MS/MS和IM-MS/MS中化合物的“溶出时间”。 溶出时间表示生物分子在分析装置内进入“分离部”,从那里到溶出的时间。 特别是,用于分离具有相同质量的分子的离子移动性引起的化合物的溶出时间依赖于化合物自身的物理化学性质、即碰撞截面积( CCS ) [7],因此是所有研究机构都能够共享的普遍物性,是仅靠MS/MS光谱无法确定的“异构体” 我尝试了通过机器学习预测这个溶出时间。 具体来说,一共让各种机器学习器(深度学习[8]和梯度提升[9]等)学习3,000种以上的化合物结构和溶出时间的信息,选择了输出最高预测[10]的学习器。 结果,决定使用基于梯度提升的XGBoost[9],以误差2.5%左右的预测精度输出了117脂质级中约60万种脂质结构(包括生物中未发现的推测结构)的溶出时间预测值。 并进行了脂质分子结构估算测试,通过整合所构建的MS/MS光谱模式识别、化合物在液相色谱中的保留时间、CCS在离子移动性中的信息全部,从分析数据中得出正确的脂质分子结构精度在99%左右( FDR )

                  将构建的算法安装在津川裕司研究员此前开发的质量分析数据综合分析程序“MS-DIAL”注1-3 )中,作为“MS-DIAL 4”向世界公开。 将MS-DIAL 4应用于理研代谢综合征研究小组过去5年测量的各种细胞、小鼠和人源性标本的高精度非靶向质谱测量数据中,捕捉到了8,051种脂质分子种类的结构多样性(图4 )。 这个结果与至今为止只捕捉到500~1,000种左右分子种类的现有研究相比,是捕捉大约10倍脂质结构多样性的技术,可以说是支撑今后脂肪质量研究的革新技术。 进而,推测了6个未报道的新脂质级结构,对于其中一个结构(在生物体中丰富的神经醯胺上新附加了一个酰基的结构),进行了化合物的全合成,进行了双键的位置和顺式/反式异构体的归属。

                    图4根据创新的非目标类毒素分析捕捉到的质量多样性

                    除了生物体内丰富存在、迄今为止进行了各种研究的基本脂质等级( PC等)之外,还概述了本研究中捕捉到的内脏器官组织特异性脂质分子种类以及本研究首次明确的脂质等级结构(相当于ASM、ADGGA、AHexCer )
                    注1 ) 2015年5月5日新闻发布会“开发全面捕捉生物体内低分子化合物的分析程序” 注2 ) 2017年11月28日新闻发布会“通过新一代代谢综合征分析发现未开拓的代谢物” 注3 ) 2019年3月29日新闻发布会“用信息科学全面阐明生物体内各种各样的代谢综合征” 今后的期待

                      目前,MS-DIAL 4作为IM-MS/MS的分析程序是世界首创的,是世界上可捕捉的脂质分子种类数量最广、精度最高的程序。 本研究的本质是,117脂质级的全部8,051脂质分子种类,可以通过基于单一测定方法的非靶标分析和基于MS-DIAL 4的分析捕捉。 迄今为止,关于脂质,通过以各自的分子种类为测量对象的靶向分析[1]进行了各论的研究。 但是生命是由多种化合物的集合体构成、维持的复杂系统,其整体理解中不可缺少本研究这样的总论性研究。 本研究成果使从脂质分子种类中全面捕捉这样的生命系统成为可能,认为代谢异常将对阐明病情背后潜藏的疾病的分子机制做出贡献。 并且,由于能够准确捕捉到人类各自所具有的脂质,因此,期待着通过阐明脂质多样性的生物学意义、鉴定与脂质分子种类的功能表达相关的基因蛋白质和靶分子,为提高人类生活质量确立新的制药战略做出贡献。

                        补充说明 1 .非靶标混合、非靶标分析、靶标分析 分析化学大致分为限定测量的生物分子种类(例如10种)的“靶标分析”和对导入质谱分析的全部代谢物一起进行分析的“非靶标分析”方法。 后者虽然得到的信息量大,但存在数据复杂的难点。 此外,“类脂体学”的学术领域以全面解析生物体中脂质分子种类的总体(类脂体),揭示复杂的生命系统为目的,“非靶向性类脂体”一词通过非靶向性解析捕捉脂质分子种类的总体, 2 .脂肪质量 这是Lipid (脂质)和Quality (质量)相乘的词语。 这是为了表现出区分以往多被视为“量”( Quantity )的脂质的“质”( Quality )差异的重要性,作为新学术领域研究“脂质质量所揭示的生命现象”的关键词而产生的语言 3 .质谱法 是通过将代谢物“离子化”,检测其离子,测量原子和分子的“质量”的分析法。 根据其离子的存在量,可以调查代谢物的含量。 另外,在质谱分析装置内,通过向代谢物附加高能量、使其碎片化来获取代谢物特异性的“质谱”,也可以推测化学结构。 4 .毫秒/毫秒频谱 串联质谱分析装置不仅可以检测来自代谢物的离子本身,还可以检测使该离子裂解而生成的离子群(碎片离子、片段离子)。 这个碎片离子光谱称为MS/MS光谱,在化合物鉴定中作为必须的指标使用。 5 .液相色谱串联质谱分析( LC-MS/MS ) 将液相色谱分离出的化合物离子化,使用质谱分析装置进行化合物检测和定量的装置。 在质谱分析装置内将离子碎片化(碎片化),测定其碎片化离子群,称为“获取MS/MS光谱”。 根据MS/MS光谱的信息,可以鉴定和推测化合物结构。 6 .离子移动性串联质谱分析( IM-MS/MS ) 在质量分析的装置内,用于分离具有相同质量的分子的方法被称为“离子移动性”。 最有名的方法是,使生物分子离子在填充有氦等惰性气体的气体室飞行,利用“与气体分子大幅相互作用的分子较慢,相反不怎么相互作用的分子会快速溶出”的原理,可以分离出相同质量的生物分子。 另外,重要的是,由于这种分子的溶出时间依赖于生物分子与惰性气体的碰撞截面积( CCS ),因此通过CCS的理论计算可以预先预测生物分子的迁移率,可以用于生物分子的鉴定。 另外,由离子移动性分离的生物分子与LC-MS/MS一样,可以获取生物分子特有的MS/MS光谱。 7 .冲击截面积( CCS ) 是表示生物结构与惰性气体碰撞截面积的指标,经常被描述为“分子旋转时的三维表面积”。 CCS的值是只要惰性气体相同,则各装置都具有互换性,是世界研究者可以共享的物理化学值。 因此,通过对照测量得到的未知代谢物的CCS和数据库中注册的(包括预测) CCS的信息,也可以应用于未知化合物的结构推断。 CCS是冲突横截面的缩写。 8 .深入学习 在日语中被称为深层学习,是支撑人工智能( AI )研究发展的机器学习法之一。 机器学习研究的目的之一是“使计算机能够进行人类进行的工作”,但是在这次的研究中,以“让计算机根据脂质结构的信息预测重要的物理化学参数- -溶出时间”为目的,使用了本方法。 这次使用的方法是,使用深层学习中最常用的叫做Keras的框架的深层神经网络。 神经网络是模仿人类神经细胞(神经元)结构的系统。 深度学习是指,通过多层使用这个神经网络,可以阶段性地更深入地学习数据中包含的特征。 然后,构建隐藏在初始输入(脂质结构)和最终输出(溶出时间)之间的最佳神经网络层次(输入和输出的精细组合),能够进行高精度的输出(溶出时间)。 9 .坡度提升、XGBoost 与深度学习一样,它是机器学习研究中经常使用的方法之一,其实现之一被称为XGBoost。 单独使用时,制作多个精度低但预测值偏差小的“弱学习器”,通过很好地组合,在保持偏差小的状态下提高精度的方法(即,通过总结弱学习器生成强学习器)称为提升。 XGBoost是将“考虑前面构筑的弱学习器的结果,构筑下一个弱学习器”的操作串联起来的学习方法。 梯度一词源于所实现的提升算法的参数估计中的优化方法符合梯度下降法的方法论。 10 .预测精度 是表示真值(正确的值)和预测值之差的词语,越小越是好的指标。 在这次研究中挑战的溶出时间( CCS )的预测,作为实验误差包含2%的测量误差,因此可以说2.5%的预测精度达到了目前可以达到的最高预测精度。 11.FDR 为了客观评价预测精度而频繁使用的指标。 将应该分类为a的正确分类为a的和设为x,将本来不应该分类为a的分类为a的和设为y时,FDR被表示为X/(X + Y )×100(% )。 FDR是“假发现率”的缩写。

                        国际联合研究小组 物理化学研究所 生命医学科学研究中心代谢综合征研究小组 研究员津川裕司 (环境资源科学研究中心元信息研究小组研究员) 队长有田诚 (庆应义塾大学药学研究科教授) 副队长(研究当时)池田和贵(池田和贵) (现任sazu DNA研究所基因组事业推进部生物分子分析小组组长) 研究生研究协会内野春希 (庆应义塾大学研究生药学研究科博士课程D2 ) 客座研究员冈桥伸幸 (大阪大学研究生院信息科学研究科副教授) 环境科学研究中心 代谢综合征信息研究小组 技术人员I高桥美纪子 钟点工II佐藤绫 技术人员I山田丰(山田丰) 队伍队长有田正规 (信息系统研究机构国立遗传学研究所教授) 综合代谢综合征研究小组 研究员东泰弘 客座研究员冈咲洋三 (三重大学生物资源学研究科副教授) 集团总监齐藤和季 (环境资源科学研究中心中心主任) 布鲁克·日本株式会社道特尼克斯事业部应用部 森美词 综合研究研究生大学生命科学研究科遗传学专业 博士三年级的多田一风太 (日本学术振兴会特别研究员DC1 ) 铁路下一代农业综合实验室 研究员保罗·博尼尼( Paolo Bonini ) 中国科学院国际显示器研究中心 博士课程D3 :地贝大象( Zhiwei Zhou ) Principal Investigator詹姆斯(正-江朱) 佛罗里达大学的pathology部门 研究员杰里米·科梅尔( Jeremy Koelmel ) 《科学条例》的实施情况 翻译元列表 关联专业人士托马斯·牙买加 加州大学戴维斯分校 西成本中介中心 奥利弗·芬恩教授研究支援 本研究主要是日本学术振兴会( JSPS )科学研究费补助金新学术领域研究“脂质质量揭示的生命现象(领域代表者:有田诚)”、该基础研究( b )“基于有助于整合分析研究的质谱信息学的新代谢控制机制的阐明(研究代表者:津川裕司)” 是在科学技术振兴机构( JST )生命科学数据库整合推进事业整合化推进计划“考虑了物质循环的代谢学信息基础(研究代表者:有田正规)”的支持下进行的。

                        原論文情報

                        • Hiroshi Tsugawa*, Kazutaka Ikeda, Mikiko Takahashi, Aya Satoh, Yoshifumi Mori, Haruki Uchino, Nobuyuki Okahashi, Yutaka Yamada, Ipputa Tada, Paolo Bonini, Yasuhiro Higashi, Yozo Okazaki, Zhiwei Zhou, Zheng-Jiang Zhu, Jeremy Koelmel, Tomas Cajka, Oliver Fiehn, Kazuki Saito, Masanori Arita & Makoto Arita*, "A lipidome atlas in MS-DIAL 4", Nature Biotechnology, 10.1038/s41587-020-0531-2


                          (*corresponding authors)

                        • 发表者 物理化学研究所 生命医学科学研究中心代谢综合征研究小组 研究员津川裕司 (环境资源科学研究中心元信息研究小组研究员) 物理化学研究所 生命医学科学研究中心代谢综合征研究小组 队长有田诚 (庆应义塾大学药学研究科教授)

                        国际联合研究小组 物理化学研究所 生命医学科学研究中心代谢综合征研究小组 研究员津川裕司 (环境资源科学研究中心元信息研究小组研究员) 队长有田诚 (庆应义塾大学药学研究科教授) 副队长(研究当时)池田和贵(池田和贵) (现任sazu DNA研究所基因组事业推进部生物分子分析小组组长) 研究生研究协会内野春希 (庆应义塾大学研究生药学研究科博士课程D2 ) 客座研究员冈桥伸幸 (大阪大学研究生院信息科学研究科副教授) 环境科学研究中心 代谢综合征信息研究小组 技术人员I高桥美纪子 钟点工II佐藤绫 技术人员I山田丰(山田丰) 队伍队长有田正规 (信息系统研究机构国立遗传学研究所教授) 综合代谢综合征研究小组 研究员东泰弘 客座研究员冈咲洋三 (三重大学生物资源学研究科副教授) 集团总监齐藤和季 (环境资源科学研究中心中心主任) 布鲁克·日本株式会社道特尼克斯事业部应用部 森美词 综合研究研究生大学生命科学研究科遗传学专业 博士三年级的多田一风太 (日本学术振兴会特别研究员DC1 ) 铁路下一代农业综合实验室 研究员保罗·博尼尼( Paolo Bonini ) 中国科学院国际显示器研究中心 博士课程D3 :地贝大象( Zhiwei Zhou ) Principal Investigator詹姆斯(正-江朱) 佛罗里达大学的pathology部门 研究员杰里米·科梅尔( Jeremy Koelmel ) 《科学条例》的实施情况 翻译元列表 关联专业人士托马斯·牙买加 加州大学戴维斯分校 西成本中介中心 奥利弗·芬恩教授

                        研究支援 本研究主要是日本学术振兴会( JSPS )科学研究费补助金新学术领域研究“脂质质量揭示的生命现象(领域代表者:有田诚)”、该基础研究( b )“基于有助于整合分析研究的质谱信息学的新代谢控制机制的阐明(研究代表者:津川裕司)” 是在科学技术振兴机构( JST )生命科学数据库整合推进事业整合化推进计划“考虑了物质循环的代谢学信息基础(研究代表者:有田正规)”的支持下进行的。

(0)

相关推荐