代谢组学技术问答(上)
该内容由“麦特绘谱”提供,已授权。
1 如何获得高质量GC/MS代谢组学数据?
实验设计先不谈,在仪器分析阶段,若想获得高质量数据,有以下几个方面需要注意。
1)前处理方法的一致性。不同实验人员操作方式不尽相同。因此,一个项目应当只由一个人负责前处理。推荐使用自动衍生设备,以减少人为的误差。
2)检测之前需确保仪器处于最佳工作状态。仪器的控制软件都有系统自检功能,可以快速便捷地核查质谱仪器的状态。但更重要的是气相色谱状态,推荐使用一组混标作为仪器质控。在每一个项目开始之前,先进行质控样检测,确认气相色谱的分离度和质谱的整体响应。
3)后期数据矫正,特别是对于大样本项目。我们可以在检测序列中加入随行质控样本(每个样品取少量后混合),在后期数据处理时,使用质控样本结合如LOESS之类的算法对整体数据进行矫正。
2 为什么有的代谢物会出不止一个峰?怎么处理?
这主要是由于衍生化反应造成的。当代谢物有多个活泼氢时,会产生三甲基硅烷基(TMS)取代数目不同的衍生产物。如甘氨酸会生成2TMS和3TMS取代的衍生物。即使衍生试剂过量,也很难保证不同TMS取代个数的产物比例会保持一致。因此,通常的做法是将同一个代谢物的所有衍生产物的面积进行加和。我公司自主开发的XploreMET软件会自动完成这一步骤。
3 代谢物的峰面积是如何计算的?
软件会对原始质谱数据做基线计算、平滑、峰查找和解卷积。在解卷积之后,软件会考察代谢物所有碎片的信噪比、碎片提取离子流图(EIC)的对称性以及碎片色谱峰的纯度(共流出干扰的程度),最终自动挑选出一个最优的定量离子(Quant Mass)。最终的峰面积是对定量离子进行积分所得。
4 什么是解卷积?
我们平常看到的总离子流色谱图(TIC)其实是软件根据质谱采集到的一个个数据点拟合出来的。每一个数据点背后就有一张质谱图。当两个或多个色谱峰没有分离开而共流出时,质谱采集到的数据点就是一张混杂的质谱图,包含了多个组分的碎片信息。如果直接用于定性分析会导致物质相似度的降低和组分的丢失。解卷积(Deconvolution)就是利用数学算法将色谱未分离的组分重新解析开,还原它们最真实的质谱信息。需要指出的是,解卷积不是万能的,好的色谱分离依然十分重要。
5 GC/MS如何提高定性准确度?
GC/MS的定性有双重标准,一是上文提到的保留指数,二是质谱信息的相似度(similarity)。不同于LC/MS的软电离源,GC/MS使用的EI源属于硬电离,能量较强且稳定,在将代谢物分子电离后,分子离子峰进一步碎裂产生丰富的碎片离子。因此,我们很难在GC/MS上看到分子离子峰。GC/MS提供的是代谢物的“指纹图谱”,将仪器得到的实际指纹图谱和质谱库(如NIST库)进行比对后,我们将会得到一个叫相似度的指标。保留指数和相似度都必须满足设定的阈值,软件才会给出色谱峰的定性结果。最后采用标准品质谱信息进行完全比对定性,也就是说只有经过标准品比对,代谢物才是被百分之百定性。
6 保留指数是什么?其目的是什么?
保留指数(Retention Index)又称科瓦茨(kovats)指数,是重要的定性指标。它需要采用一系列保留指数基准物质(如脂肪酸甲酯和正构烷烃)作为参考,将保留时间转换为指数。相比于保留时间,保留指数的特点是它只和色谱柱类型有关,而和其他仪器参数无关。例如,针对不同的生物样品,我们可能需要不同的升温程序,以达到最佳的色谱分离。此时,代谢物的保留时间就会发生改变,无法和质谱库中的标准时间进行匹配。再比如,色谱柱使用较长时间后,柱前端容易被严重污染,从而影响柱效。我们一般会将柱前端截断30-50公分(更好的方法是色谱柱前添加保护芯片)以恢复柱效。此时,所有代谢物的保留时间都会提前。保留指数不会受到这些实验条件的影响,依然可以用于准确定性。
7 GC/MS能检测到哪些类别的代谢物?
衍生化极大地拓展了GC/MS的检测分析范围。GC/MS能检测到有机酸、氨基酸、单糖、糖醇、胺类、脂肪酸、吲哚、单甘油酯、核苷、二糖、生育酚、甾醇和胆汁酸等代谢物。
8 GC/MS分析生物样本为何要衍生化处理?有哪些衍生化的方法?
GC的流动相为气体(通常为高纯氦),这就要求被分析物必须能够气化,而生物样本中很多内源性代谢物都含有极性基团,具有沸点高、不易气化特点。衍生化能够降低这些代谢物的沸点,增加它们的热稳定性,以便分析能够顺利进行。衍生化方法及试剂种类繁多,根据不同的分析目标,需选择合适的衍生化方法。如分析脂肪酸,我们可以采用甲酯化衍生。在GC/MS代谢平台上,最常用的衍生化方法是硅烷化衍生,因为它的广谱高效。在进行硅烷化衍生之前,还需添加甲氧胺吡啶溶液,以封闭羰基(针对α-酮酸和糖类,保护作用),减少衍生化副产物的生成。
9 GC/MS平台有哪些
目前,市面上和GC串联的质谱有多种,如TOF、Quadrupole、Linear Ion Trap、Orbitrap、Sector MS以及串接质谱如Q-TOF,TQ等等。目前在代谢组学领域应用最广泛的还是GC-TOFMS平台,因为它具有高通量、高灵敏和稳定性好等优势。对于靶向定量代谢组学,则可选择GC-TQMS。
10 使用临床样本进行代谢组学研究大概需要多少样本数量?另外如何控制临床样本的质量?
对于临床的样本建议每组最低50个生物学重复,如果能从大量样本遴选排除其他疾病干扰或者是性别、年龄、BMI指数均一的样本是最理想的,另外样本重复数越多数据结果越可靠。
11 是否可以通过代谢组学研究来预测肝脏疾病可能的损伤类型?
可以,最近我们做了一个很有意思的研究。通过对人群进行一定的负载,我们利用胆汁酸、脂肪酸(含短链脂肪酸)、氨基酸肉碱就能够很好的判断肝脏的损失情况,并且还有另外的一组数据显示,肝功能指标正常,胆汁酸的异常已经很明显,所以我们认为胆汁酸可以用于肝脏损伤的类型来研究。
12 对于临床样本而言,寻找生物标志物时个体差异太大了,请问关于找标志物组大概是怎么做的?
代谢组学首先要控制样本质量,性别、年龄、收集疾病用的正常对照要在同一家医院、如果多中心的(各个中心都要收集对照)这些可控的因素要控制好,后续虽然也有矫正方案,但不如开始的时候就考虑进去为好。
样本数目, 这个和疾病相关。
统计方法,多维统计的方法往往比单维统计在找代谢物组上有优势,两种方法互为补充和验证。
13 采用动物模型进行非靶向代谢组学研究时,其饮食对于代谢物是有影响吗?请问关于动物的饮食有什么注意事项?
很好的问题。动物的饮食量、饮水量都要忠实记录。在后续的分析当中会用到。硅烷化衍生的气质联用的非靶向技术平台可以有效的避开食物、植物和药物代谢物的影响,这也是为什么我们优选这个平台快速筛选出差异代谢物和代谢通道。
14 做代谢组学必须要自己建立一个标准品library吗?
是必须的!全世界代谢组学最好的公司Metabolon、Biocrates,包括我们麦特绘谱的共性即是强大的代谢组学标准品库。对于非靶向代谢组学研究来说,没有标准品库,就没办法进行准确定性,对于定量代谢组学而言,没办法获得标准曲线和质控。
未完,待续。。。