我的细胞系还是我以为的细胞系嘛?

写在前面

我们在做细胞实验的时候,经常会有这样的疑虑,细胞被那么多人蹂躏了那么多次了,那我现在操作的细胞当时我以为的那个细胞系嘛?会不会有人在传代的时候不小心把这个细胞系的名字写成了另外的名字,然后就这样一直传下去了呢。

这种问题,除非买一株新的细胞,不然的话,就会一直有这个疑虑的。今天呢,就给大家介绍一个新发表的数据库。这个数据库有可能会解决大家的疑虑的,这个数据库叫做CCLA (Cancer Cell Line , http://bioinfo.life.hust.edu.cn/web/CCLA/)。

数据库原理
在了解这个数据库操作之前,我们可以来了解一下这个数据库是怎么来进行肿瘤细胞系认证的。基本的操作分析流程类似于我们做模型预测的流程。所以其实通过这个流程还是可以了解一下大致的模型预测都是怎么做的。

1. 背景数据收集

如果要对一个未知的细胞系进行认证的话。优先的就是需要收集已知的细胞系表达数据。利用这些数据当作一个背景数据集。这个数据库总共收集到了CCLE、GDSC以及CHCC三个数据库当中的1291个细胞系的基因组表达数据当作背景数据集。

2. 构建模型

所有预测的性质的东西都是要基于之前的数据构建一个模型的。这个数据库在收集到上面的数据之后,下一步就是构建模型了。由于每个细胞系使用的基因组的表达表达数据是不一样的。所以就需要进行标准化。数据库通过ssGSEA的算法对所有细胞系的表达数据进行了标准化,进一步利用随机森林的方法构建了预测模型。

3. 数据预测

模型构建好之后,就可以进行细胞系预测了。细胞系预测的数据使用的是细胞系的表达谱芯片或者是二代测序的表达数据。我们需要提交相关的表达数据。然后数据库会先自行进行标准化,然后来使用模型进行预测。

数据库使用

介绍为了数据库的基本预测原理。那么对于数据库的使用就简单了。通过三步我们就能够预测细胞系种类了。

其中预测的细胞系选择当中,我们可以选择类似CCLE这样900多个细胞系来一起预测。同时也可以选择单一的细胞系来进行预测。
结果解读

对于数据库的结果,首先,数据库会展示每一个样本最可能是什么的总结。

其次,对于每一个样本的信息也会有一个详细的结果,包括前五的可能的细胞系这样的话,如果我们的细胞系最可能的不是目标细胞系,在这里可以看看前五的有没有。毕竟结果还是有偏差的。
写在最后
以上就是这个数据库的所有相关的东西了。关于数据库的时候,由于需要提供这个细胞系的表达谱的数据,所以相对来说还是有一定的门槛的。不过随着测序价格的降低,基本上应该都会有自己细胞系的测序结果的吧。
另外需要注意的是,其实我们在使用之前应该看一下这个数据库有没有包含自己想要验证的细胞系。如果没有的话,那肯定也就出不来结果了。
欢迎大家「三连」!
(0)

相关推荐

  • Genome Medicine|警惕!研究发现,大多数在培养皿中培养的癌细胞与人体中的癌细胞几乎没有共同之处

    约翰 · 霍普金斯医学院的科学家们报告说,为了找到或改进实验室癌症研究模型,以便更好地与活人身上发生的情况进行比较,他们开发了一种新的基于计算机的技术,显示在培养皿中培养的人类癌细胞在遗传学上与其人类 ...

  • 智能制造装备预测性维护技术研究和标准进展

    导读 本文针对数字化.网络化.智能化技术和制造业的深度融合下,智能制造装备需要更加高效与智能的实际需求,总结了现有设备运维技术存在的问题.最新技术发展和标准化进展,提出了最新预测性维护技术的定义和优势 ...

  • 细胞系移植性肿瘤小鼠模型(CDX)构建

    细胞系移植性肿瘤模型是最为常见和使用最广泛的小鼠模型,原理是将肿瘤细胞系注射到小鼠皮下或任意想要研究的发病部位,肿瘤细胞将在注射处增殖生长.常用的移植小鼠品系是裸鼠BALB/c-nu. (1)皮下移植 ...

  • 阿司匹林功能新开发,抑制结直肠癌复发

    自1898年上市以来,阿司匹林对于缓解疼痛,感冒.流感等发热疾病的退热,治疗风湿等方面都有显著的疗效.100多年来,阿司匹林的功效还在不断的开发之中近年来发现阿司匹林对血小板聚集有抑制作用,能阻止血栓 ...

  • 除了利用SEER、TARGET数据,你还可以利用这个数据库做预测模型

    除了利用SEER.TARGET数据,你还可以利用这个数据库做预测模型,这个数据库就是TCGA呀,TCGA也包含大量的临床信息,可以通过下载它的临床数据来进行预测模型,TCGA临床数据的下载方法有很多种 ...

  • 托国家队的福!又结识了一个全能的“王者级”lncRNA数据库!

    解螺旋公众号·陪伴你科研的第2415天 lncRNA数据库中的多面手 由于今天这款lncRNA数据库实在是重磅,我就直接告诉大家吧,不管你是做基础研究还是做疾病研究,不管你是研究肿瘤还是非肿瘤,不管你 ...

  • CIRCpedia v2:circRNA注释及表达数据库

    导语 环状RNA(circular RNAs, circRNA)是一类由 mRNA 前体经反向可变剪切而来的共价闭合且保守的单链转录本,长度跨度从几十bp到几千bp,在表观遗传及各种细胞过程中发挥重要 ...

  • 根据基因表达数据预测药物作用

    最近接到粉丝求助,他看到了一个很简单的肿瘤单基因数据挖掘文章:A TP53-associated gene signature for prediction of prognosis and ther ...

  • 细胞系定制流程

    外源质粒DNA整合到宿主细胞染色体上,使宿主细胞可长期表达目的蛋白,称稳定细胞系.稳定细胞系在生物学研究中扮演着非常重要的角色,包括基因功能研究.重组抗体.药物开发等.然而构建一个有效的细胞系是一件复 ...

  • 人源肿瘤细胞系异种移植(CDX)模型构建

    人源肿瘤细胞系异种移植(CDX),即将体外传代培养的肿瘤细胞接种至免疫缺陷小鼠,是研究肿瘤细胞增殖以及体内筛选药物最常用的模型之一.由于细胞体外长期传代而呈现有高同源性特点,模型建立容易.重复性好,但 ...

  • 细胞系与细胞株之间的区别

    细胞株(Cell Strain):通过选择法或克隆形成法从原代培养物或细胞系中获得具有特殊性质或标志物的培养物称为细胞株(Cell Strain),也就是说,细胞株是用单细胞分离培养或通过筛选的方法, ...

  • 细胞系或细胞株的构建原理

    细胞系或细胞株的构建原理

  • 慢病毒系统建立基因敲除细胞系

    CRISPR是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,因为病毒能把自己的基因整合到细菌,利用细菌的细胞工具为自己的基因复制服务,细菌为了将病毒的外来入侵基因清除,进化出CRISPR系统.这是 ...

  • KI细胞系的应用前景

    在细胞系中敲入报告基因是CRISPR/Cas9最常见的应用之一,本文详细介绍了报告细胞系的原理.构建策略以及应用前景,希望能给广大科研工作者提供一个比较前沿的研究思路. 1.什么是报告细胞系和报告基因 ...

  • cas9细胞系应用

    CRISPR/Cas9细胞基因敲除系统软件由有DNA激光切割特异性Cas9蛋白质及鉴别特异性靶标的gRNA构成,因为只需对系统组件中的gRNA开展编写就能完成靶标鉴别,巨大了简单化了搭建基因敲除媒介的 ...

  • 基因敲除细胞系构建步骤

    生物学家在基因敲除细胞以前都是先做遗传基因敲低,可是因为shRNA的技术性自身的限定没法得到基因功能完全缺少的体细胞,乃至常常会出現shRNA敲低了,可是体细胞WB实际效果不太好:另外Knockout ...

  • miRNA、lncRNA 敲除细胞系构建技术原理

    基因敲除敲入技术一直是研究特定基因功能的有效工具.近10年来,mRNA在医学应用领域取得显著进展.研究人员可快速合成任意序列的mRNA片段,并能保存在室温条件下.在无细胞的体系中利用DNA转录生成ca ...