没想到自己会放弃conda（docker镜像的pyscenic做单细胞转录因子分析）

2024-06-16 00:43:14

本来是想测试一下，使用pyscenic做转录因子分析，然后记录笔记给大家！所以就有了昨天的：使用pyscenic做转录因子分析，但实际上我在里面埋下了一个伏笔，就是使用conda安装的这个pyscenic，它依赖于一系列的python模块，就会在这里报错！比如我遇到的就是其中一个python模块pandas的报错：

ImportError: cannot import name 'DtypeArg' from 'pandas._typing' (/home/x10/miniconda3/envs/pyscenic/lib/python3.7/site-packages/pandas/_typing.py)

不过，我使用了docker镜像的pyscenic，所以绕过了这个报错！那，我们现在演练一下如何使用docker镜像的pyscenic吧！

需要root权限安装docker

通常情况下，可以找你的服务器管理员帮助你安装docker，并且添加你加入docker用户组，这样你就有权限使用它！

# https://docs.docker.com/engine/install/ubuntu/ sudo apt-get install apt-transport-https ca-certificates curl gnupg lsb-release curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu \ $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io


sudo usermod -aG docker x10

 sudo systemctl restart docker

所以，这个代码，大概率你是无需学习也无需弄懂，找你的管理员即可！

docker是一个解决方案，可以做到真正的一句话代码安装

它不仅仅是帮你安装软件，还打包好测试数据，运行的示例，配套数据库，甚至还赠送你一个操作系统！我在生信技能树上面写过部分docker教程，目录如下：

感兴趣的可以简单浏览，如果要完全掌握，仍然是推荐大家看文档，多练习。比如gistic2就有docker镜像，一句话解决战斗：

docker pull cheungatm/gistic2:v2

同理，docker镜像的pyscenic 也是一句话：

docker pull aertslab/pyscenic:0.10.0

如果网络OK的话，你会看到如下所示的成功信息：

# https://pyscenic.readthedocs.io/en/latest/installation.html


0.10.0: Pulling from aertslab/pyscenic

f5d23c7fed46: Pull complete

bac1b0ed365c: Pull complete

0699bcf8d873: Pull complete

f306e429bf35: Pull complete

64d56457d658: Pull complete

cd7482e5a1bf: Pull complete

37b049e1bc6b: Pull complete

Digest: sha256:48f84d615640ac3da4086ac79c383dd82009ab83952a64e78be40d007e68b72a

Status: Downloaded newer image for aertslab/pyscenic:0.10.0

docker.io/aertslab/pyscenic:0.10.0

安装好了docker镜像的pyscenic，接下来就是使用它！

使用pyscenic这个docker镜像里面的python

同样的，自己准备好如下所示的文件，如果有疑问，可以看昨天的：使用pyscenic做转录因子分析：

54M 7月 18 11:18 fibo_1000.csv 1.1G 7月 18 11:30 hg19-tss-centered-10kb-7species.mc9nr.feather 12K 7月 18 11:29 hs_hgnc_tfs.txt 99M 7月 18 11:29 motifs-v9-nr.hgnc-m0.001-o0.0.tbl

然后进入pyscenic这个docker镜像里面的python，进行csv文件转换为loom文件

docker run -it --rm -v /home/x10/test/pyscenic/:/scenicdata aertslab/pyscenic:0.10.0 # 默认直接进入python，可以输入python代码

我输入的python代码如下所示：

import os, sys os.getcwd() os.listdir(os.getcwd()) os.chdir("/scenicdata" )

import loompy as lp; import numpy as np; import scanpy as sc; x=sc.read_csv("fibo_1000.csv"); row_attrs = {"Gene": np.array(x.var_names),}; col_attrs = {"CellID": np.array(x.obs_names)}; lp.create("sample.loom",x.X.transpose(),row_attrs,col_attrs);

这个代码就会把我服务器的/home/x10/test/pyscenic/文件夹里面的 fibo_1000.csv 这个文件，转为 sample.loom 文件。

假如你使用conda安装的这个pyscenic，它依赖于一系列的python模块，就会在这里报错！比如我遇到的就是pandas的报错：

ImportError: cannot import name 'DtypeArg' from 'pandas._typing' (/home/x10/miniconda3/envs/pyscenic/lib/python3.7/site-packages/pandas/_typing.py)

不过，现在，我使用了docker镜像的pyscenic，所以绕过了这个报错！

使用pyscenic这个docker镜像的pyscenic命令

首先使用pyscenic命令的 grn 子命令，如下所示：

docker run -it --rm -v /home/x10/test/pyscenic/:/scenicdata aertslab/pyscenic:0.10.0 \ pyscenic grn \ --num_workers 20 \ --output /scenicdata/adj.sample.tsv \ --method grnboost2 \ /scenicdata/sample.loom \ /scenicdata/hs_hgnc_tfs.txt

前面的 fibo_1000.csv 文件里面是1000成纤维细胞的表达量矩阵，20min就完成了这个步骤！

2021-07-18 08:03:35,140 - pyscenic.cli.pyscenic - INFO - Loading expression matrix.


2021-07-18 08:03:41,720 - pyscenic.cli.pyscenic - INFO - Inferring regulatory networks.
2021-07-18 08:24:21,520 - pyscenic.cli.pyscenic - INFO - Writing results to file.

再运行 cistarget 这个子命令：

docker run -it --rm -v /home/x10/test/pyscenic/:/scenicdata aertslab/pyscenic:0.10.0 \ pyscenic ctx \ /scenicdata/adj.sample.tsv \ /scenicdata/hg19-tss-centered-10kb-7species.mc9nr.feather \ --annotations_fname /scenicdata/motifs-v9-nr.hgnc-m0.001-o0.0.tbl \ --expression_mtx_fname /scenicdata/sample.loom \ --mode "dask_multiprocessing" \ --output /scenicdata/reg.csv \ --num_workers 3 \ --mask_dropouts

时间消耗如下：

2021-07-18 08:56:47,900 - pyscenic.utils - INFO - Creating modules.


2021-07-18 08:58:26,099 - pyscenic.cli.pyscenic - INFO - Loading databases.
2021-07-18 08:58:26,099 - pyscenic.cli.pyscenic - INFO - Calculating regulons.
2021-07-18 09:38:00,673 - pyscenic.cli.pyscenic - INFO - Writing results to file.

最后运行AUCell 这个子命令，这个步骤超级快

docker run -it --rm -v /home/x10/test/pyscenic/:/scenicdata aertslab/pyscenic:0.10.0 \ pyscenic aucell \ /scenicdata/sample.loom \ /scenicdata/reg.csv \ --output /scenicdata/sample_SCENIC.loom \ --num_workers 3

时间消耗如下：

2021-07-18 09:40:42,311 - pyscenic.cli.pyscenic - INFO - Loading expression matrix.


2021-07-18 09:40:43,745 - pyscenic.cli.pyscenic - INFO - Loading gene signatures.

Create regulons from a dataframe of enriched features.
2021-07-18 09:41:00,699 - pyscenic.cli.pyscenic - INFO - Calculating cellular enrichment.
2021-07-18 09:41:18,550 - pyscenic.cli.pyscenic - INFO - Writing results to file.

既然docker如此好用

首先你不一定有自己的服务器，其次你的服务器也不一定有docker环境。而我们提供手快有，手慢无（共享96线程384G内存服务器），一站式解决单细胞高级数据分析！

[原创]Dapr入门教程之二：Dapr的安装

安装Dapr的CLI 在安装Dapr runtime之前需要先安装Dapr的CLI.有两个原因,第一,如果你以后不是用Helm来安装Dapr的话,需要用Dapr CLI来执行dapr init.第二, ...
docker容器的基本使用

### Docker中镜像的基本使用以及Docker的基本使用 #### 1.Docker的安装 ``` 先进入终端,然后使用以下命令: sudo apt-get update sudo apt-ge ...
是时候跟Docker说再见了

在容器的远古时代 (差不多就是 4 年前),Docker 是这场游戏的唯一玩家.但现在情况已经不一样了,Docker 不再是唯一玩家,而只是一个容器引擎而已.我们可以用 Docker 构建.运行.拉取 ...
部署 Asp.Net Core 应用到 Docker

前言: 今天不说Docker 是啥,容器是啥镜像又是啥(如果这些不知道,请自行学习),今天很单纯的将 .Net Core 应用程序部署到Docker上. 起因: 好多同学私信让我写篇能落地的[一步步] ...
从iso文件到可以随时移植的虚拟机vdi镜像（Ubuntu20版本和R语言4.0版本）

[toc] 我从ubuntu官网下载了ubuntu20.04版本的系统iso文件,我是想将这个iso镜像按照自己的需求进行配置,最后形成一个可以随时将这个文件移植到任何电脑的一个系统. 镜像下载地址: ...
容器摆脱主机环境限制，随心所欲编译Android源码

TinkerS OSC开源社区昨天使用docker编译aosp源码 google官方推荐的安卓编译源码为14.04,由于目前的工作环境为macosx环境或者高版本的ubuntu环境,直接在本机编译 ...
2021年 Windows10 环境下使用WSL和Docker 配置深度学习环境

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 Windows10 环境下使用WSL2和Docker 配置深度学习环境以及踩坑记录 (使用 Ubuntu 18.04+ Cuda) 前 ...
这位宝妈是清华大学硕士学位，没想到会选择放弃高薪回家带娃

辛辛苦苦考上清华大学,一直到硕士毕业,然后放弃了高薪工作,选择自己创业的可能有不少,但是选择回家带孩子做全职妈妈的,几乎没有的吧,但如今却有了,这位清华妈妈还坚定地说,"自己不会后悔&quo ...
红豆加红薯，没想到这么好吃，我家3天2头做，无糖少油营养健康

红豆加红薯，没想到这么好吃，我家3天2头做，无糖少油营养健康
花菜和番茄放一起，没想到这么好吃，最近3天2头做，还是吃不够

花菜和番茄放一起，没想到这么好吃，最近3天2头做，还是吃不够
社区团购被点名批评后，巨头们并没有放弃，但是没想到后院起火！

社区团购被点名批评后，巨头们并没有放弃，但是没想到后院起火！
从期待、激动，到失望、放弃，满月小程序高开低走，张小龙可能万万没想到！

原创稿件,转载请授权自带爆点的微信小程序,发布一个月以来,很快被"打回原形",姥姥不疼舅舅不爱,几乎成了"留守儿童." 曾经的"万人迷", ...
没想到！“盗梦空间”里奇幻镜像建筑真的存在

近些年国产悬疑剧层出不穷,但一部轻科幻悬疑剧<在劫难逃>引起小吧的注意,片头巧妙运用镜像营造了一个多重世界的效果. Gif图来源于<在劫难逃> 很容易就让人联想到<盗梦空 ...
洋葱里打两个鸡蛋，没想到这么好吃，营养美味，孩子三天两头要吃

洋葱里打两个鸡蛋，没想到这么好吃，营养美味，孩子三天两头要吃
万万没想到！高血压的'罪魁祸首'不是盐，竟是它…很多人都忽略了

大家都知道,食盐摄入过多容易诱发高血压,主要是因为里面的钠离子. 但不是说做饭时少放点盐就万事大吉了,还有许多其他食物中也含有较多的钠,它们同样是诱发高血压的元凶. 钠从哪里来? 除了食盐外,我们吃的 ...
食谱 | 没想到这个“包包”竟然能吃！一定要给妈妈做礼物！

明天就是母亲节了,礼物要从现在就开始准备起来咯~如果实在想不出送什么,那么蛋糕一定不会出错!一份甜甜蜜蜜的美丽心情,适合天下所有的妈妈. 最近小卡看了热播剧<小舍得>,发现蒋欣饰演的角色, ...