生信技能树学习笔记
Anaconda 的官网是 https://www.anaconda.com/
官网上介绍anaconda是所有语言的包、依赖和环境管理器。
Conda之间的关系如下
当我们使用服务器分析数据,我们使用miniconda,如果在自己的电脑上使用anaconda。Anaconda安装网上有很多教程,也可以在淘宝上买个安装服务(至少节省一上午时间)。
我们今天介绍的是在linux系统中安装miniconda。
首先,我们为什么要安装conda?
因为在数据分析过程中我们要使用很多种软件,软件安装中会遇到各种问题。
第一步——conda的安装
打开termius,并登录服务器
#使用国内镜像下载conda,在家目录下输入
wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
## 安装,安装过程只需要输入 yes不能回答no 或者按 Enter。因为安装包是一个.sh结尾的shell脚本,因此需要用shell的解释器(比如bash)来运行。
bash Miniconda3-latest-Linux-x86_64.sh
## 重新激活环境,让修改生效,把 ~/.bashrc 当成一个整体不容易出错。这一步也可以用也可以直接退出当前窗口重新登录替代。
source ~/.bashrc
## 查看 conda 的帮助文档,能够用输出conda的帮助文档就说明安装成功啦!
conda –help
##(这个步骤可选)设置了就每次需要使用conda的时候要激活 conda activate不设置就每次登录上来就自动会在状态栏里有一个(base)的环境提示
conda config --set auto_activate_base false
第二步——配置频道
我们使用 conda 安装软件时,conda 会去 channel 中搜索软件,如果使用的服务器是在国内,channel 就选择国内的,推荐清华,如果清华镜像出问题,再选择其他。
## 配置镜像
# 下面四行配置北京外国语大学的conda的channel地址(首选)
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes
# 下面这四行配置清华大学的conda的channel地址(首选北外,如果体验不好再换成清华)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes
# 如果需要官方频道,可以添加下面这两行配置官网的channel地址(不推荐)
conda config --add channels conda-forge
conda config --add channels bioconda
# 删除defaults频道
sed -i '/defaults/d' ~/.condarc
## 配置镜像成功
# 查看配置结果
cat ~/.condarc
tips1:不要重复添加相同的频道,冗余的频道会让安装软件的过程变慢顺序是有意义的
tips2:添加镜像要看服务器所在的位置,不是使用者所在的位置
第三步——创建独立小环境
为什么要创建独立的环境? 全装在base里不好吗?
给新人的建议:不要往base环境里安装任何软件包“蛇”(anaconda)就应该关在“笼子”(小环境)里。
1. conda会改变你原来设置好的环境
2. 不同的软件的依赖会互相冲突 。A软件依赖python2.7,B软件依赖python3.8
3. 方便项目管理。基因组、转录组、Chip-seq……
具体步骤:
# 创建名为rna的软件环境来安装转录组学分析的生物信息学软件
conda create -y -n rna python=3.7
这一步输入y或回车都可以
# 创建小环境成功,并成功安装python3版本
# 每建立一个小环境,安装一个python=3的软件作为依赖
# 查看当前conda环境
conda info -e
conda env list
# 每次运行前,激活创建的小环境rna
conda activate rna
# 退出小环境
conda deactivate
补充:小环境的创、删、改
创
创建环境: conda create -n rna
创建环境时可以预先指定环境的依赖版本:conda create -n py2 python=2.7
删
删除已创建的小环境及安装的包conda remove -n rna –all
改
如何重命名一个小环境呢?
先克隆一个新的,再删除掉旧的
conda create -n Python2
conda create -n py2 --clone Python2
conda remove -n Python2 –all
或者这样修改名称
Tips:软件能不更新就不更新,不能用了直接重新安装。
第四步——软件安装。
1,先要知道自己要装哪些软件,比如:
2.这个软件能不能用conda安装
方法1:网站查询
https://bioconda.github.io/
https://anaconda.org/search
方法2:conda search xxx
方法3:关键词搜索
安装软件
注:软件都要安装在小环境中,不要安装在 base
# 激活环境
conda activate rna
# 安装 fastqc 软件
conda install fastqc
# 调出帮助文档
fastqc --help
# 可以指定软件版本
conda install -y samtools=1.14
# aspera
conda install -y -c hcc aspera-cli
ascp --help
# 可以一次安装多个软件
conda install -y python=3.7 libstdcxx-ng=9.1.0 trim-galore cutadapt=4 hisat2 subread multiqc samtools=1.16.1 salmon=1.4.0 fastp fastqc
# mamba install -y python=3.7 libstdcxx-ng=9.1.0 trim-galore hisat2 subread multiqc samtools=1.14 salmon=1.4.0 fastp fastqc
## 不是通过软件名来调用帮助文档,而是软件的命令,-help可以用来确定软件是否安装成功
# sra-tools
prefetch --help
fastq-dump --help
which prefetch
# trim-galore
trim_galore --help
# hisat2
hisat2 --help
# subread
featureCounts --help
# multiqc
multiqc --help
# samtools
samtools --help
# salmon
salmon --help
# fastp
fastp –help
问题1:如何指定安装的软件的版本?
在不指定版本的情况下,conda 默认安装该软件的最新版。如果要安装旧版本:
1. 先看看有哪些可以安装的版本conda search fastqc
2. 安装指定版本的软件conda install fastqc=0.11.7
添加-y参数跳过确认步骤conda install -y fastqc=0.11.7
问题2:安装了这个软件包但是调用不了是怎么回事?
安装的软件包的名称和实际调用的程序不一定是同名的!
例如:我们安装的是subread,调用的是其软件包里的子程序featureCounts;
我们安装的是sra-tools,调用的是prefetch;
我们安装的是blast,调用的是blastp
三个特殊情况 trim_galore -> trim-galore
vep -> ensembl-vep
sratoolkit -> sra-tools
查看conda环境中已安装的软件
基本用法:conda list
查看当前环境所安装的软件
扩展用法:1.查看符合正则表达式的软件conda list fast*
2.查看指定的环境的软件conda list -n rna
删除软件
conda remove fastqc
想要删除特定环境下的特定软件,如何指定?
conda remove -n rna fastqc
不指定-n参数就得进入该环境之后才能进行删除操作,同样,-y能够跳过确认执行的步骤
Conda常用命令
补充
生信技能树学习笔记
前情提要:1.安装conda
2.配置镜像
# 创建R4环境
conda create -y -n R4 python=3.8
# 激活R4环境
conda activate R4
# (可选步骤:在R4里安装mamba)
# conda install mamba
# 安装R语言本体
conda install -y r-base=4.2
## 或者使用mamba安装:mamba install -y r-base=4.1.2
# 安装R语言软件包(安装命令可从Linux软件安装.md文件中查找)安装时间较久
conda install -y r-getopt r-tidyverse r-ggplot2=3.3.5 bioconductor-limma bioconductor-edger bioconductor-deseq2 bioconductor-clusterprofiler bioconductor-org.hs.eg.db=3.13.0
## 或者使用mamba安装:mamba install -y r-getopt r-tidyverse r-ggplot2=3.3.5 bioconductor-limma bioconductor-edger bioconductor-deseq2 bioconductor-clusterprofiler bioconductor-org.hs.eg.db=3.13.0
##最后这两个包可能比较难安装,如果尝试后安装不上,可以用R的方式安装:
1.在状态栏里输入R并回车
2.在R的交互框里输入install.packages("BiocManager")
3.输入BiocManager::install("org.Hs.eg.db")
Q: 如何验证R语言的包安装情况?
#激活R
conda activate R4
# 输入R进入R语言的交互
R
在R语言里验证安装包:
library(getopt)
library(tidyverse)
library(ggplot2)
library(limma)
library(edgeR)
library(DESeq2)
library(clusterProfiler)
library(org.Hs.eg.db)
Q: 如何知道这些包到底叫啥?哪儿该大写哪儿该小写?
A: [Bioconductor - Home](https://bioconductor.org/) 在Bioconductor的官网搜索即可。
最后这两个包可能比较难安装,如果尝试后安装不上,可以用R的方式安装,例如:
在状态栏里输入R并回车,并配置镜像
options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))) options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
2.在R的交互框里输入: install.packages("BiocManager")
3.输入: BiocManager::install("org.Hs.eg.db")
最后
# 如果有mamba的话可以用mamba安装
# mamba env create -n rna -f rna.yaml
conda env create -n R4 -f R4.yaml
其他用法
卸更新软件:conda update 软件名
载软件:conda remove 软件名
删除环境:conda remove -n 环境名
克隆环境:conda create –n 新环境名 –clone 旧环境名
查找软件:conda search 软件名
查找软件常用的链接:
https://anaconda.org/search
https://bioconda.github.io/