前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >生信分析之conda安装

生信分析之conda安装

作者头像
生信菜鸟团
发布2024-07-10 16:48:09
1830
发布2024-07-10 16:48:09
举报
文章被收录于专栏:生信菜鸟团

生信技能树学习笔记

Anaconda 的官网是 https://www.anaconda.com/

官网上介绍anaconda是所有语言的包、依赖和环境管理器。

Conda之间的关系如下

当我们使用服务器分析数据,我们使用miniconda,如果在自己的电脑上使用anaconda。Anaconda安装网上有很多教程,也可以在淘宝上买个安装服务(至少节省一上午时间)。

我们今天介绍的是在linux系统中安装miniconda。

首先,我们为什么要安装conda?

因为在数据分析过程中我们要使用很多种软件,软件安装中会遇到各种问题。

第一步——conda的安装

打开termius,并登录服务器

#使用国内镜像下载conda,在家目录下输入

wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

## 安装,安装过程只需要输入 yes不能回答no 或者按 Enter。因为安装包是一个.sh结尾的shell脚本,因此需要用shell的解释器(比如bash)来运行。

bash Miniconda3-latest-Linux-x86_64.sh

## 重新激活环境,让修改生效,把 ~/.bashrc 当成一个整体不容易出错。这一步也可以用也可以直接退出当前窗口重新登录替代。

source ~/.bashrc

## 查看 conda 的帮助文档,能够用输出conda的帮助文档就说明安装成功啦!

conda –help

##(这个步骤可选)设置了就每次需要使用conda的时候要激活 conda activate不设置就每次登录上来就自动会在状态栏里有一个(base)的环境提示

conda config --set auto_activate_base false

第二步——配置频道

我们使用 conda 安装软件时,conda 会去 channel 中搜索软件,如果使用的服务器是在国内,channel 就选择国内的,推荐清华,如果清华镜像出问题,再选择其他。

## 配置镜像

# 下面四行配置北京外国语大学的conda的channel地址(首选)

conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/

conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/

conda config --set show_channel_urls yes

# 下面这四行配置清华大学的conda的channel地址(首选北外,如果体验不好再换成清华)

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/

conda config --set show_channel_urls yes

# 如果需要官方频道,可以添加下面这两行配置官网的channel地址(不推荐)

conda config --add channels conda-forge

conda config --add channels bioconda

# 删除defaults频道

sed -i '/defaults/d' ~/.condarc

## 配置镜像成功

# 查看配置结果

cat ~/.condarc

tips1:不要重复添加相同的频道,冗余的频道会让安装软件的过程变慢顺序是有意义的

tips2:添加镜像要看服务器所在的位置,不是使用者所在的位置

第三步——创建独立小环境

为什么要创建独立的环境? 全装在base里不好吗?

给新人的建议:不要往base环境里安装任何软件包“蛇”(anaconda)就应该关在“笼子”(小环境)里。

1. conda会改变你原来设置好的环境

2. 不同的软件的依赖会互相冲突 。A软件依赖python2.7,B软件依赖python3.8

3. 方便项目管理。基因组、转录组、Chip-seq……

具体步骤:

# 创建名为rna的软件环境来安装转录组学分析的生物信息学软件

conda create -y -n rna python=3.7

这一步输入y或回车都可以

# 创建小环境成功,并成功安装python3版本

# 每建立一个小环境,安装一个python=3的软件作为依赖

# 查看当前conda环境

conda info -e

conda env list

# 每次运行前,激活创建的小环境rna

conda activate rna

# 退出小环境

conda deactivate

补充:小环境的创、删、改

创建环境: conda create -n rna

创建环境时可以预先指定环境的依赖版本:conda create -n py2 python=2.7

删除已创建的小环境及安装的包conda remove -n rna –all

如何重命名一个小环境呢?

先克隆一个新的,再删除掉旧的

conda create -n Python2

conda create -n py2 --clone Python2

conda remove -n Python2 –all

或者这样修改名称

Tips:软件能不更新就不更新,不能用了直接重新安装。

第四步——软件安装。

1,先要知道自己要装哪些软件,比如:

2.这个软件能不能用conda安装

方法1:网站查询

https://bioconda.github.io/

https://anaconda.org/search

方法2:conda search xxx

方法3:关键词搜索

安装软件

注:软件都要安装在小环境中,不要安装在 base

# 激活环境

conda activate rna

# 安装 fastqc 软件

conda install fastqc

# 调出帮助文档

fastqc --help

# 可以指定软件版本

conda install -y samtools=1.14

# aspera

conda install -y -c hcc aspera-cli

ascp --help

# 可以一次安装多个软件

conda install -y python=3.7 libstdcxx-ng=9.1.0 trim-galore cutadapt=4 hisat2 subread multiqc samtools=1.16.1 salmon=1.4.0 fastp fastqc

# mamba install -y python=3.7 libstdcxx-ng=9.1.0 trim-galore hisat2 subread multiqc samtools=1.14 salmon=1.4.0 fastp fastqc

## 不是通过软件名来调用帮助文档,而是软件的命令,-help可以用来确定软件是否安装成功

# sra-tools

prefetch --help

fastq-dump --help

which prefetch

# trim-galore

trim_galore --help

# hisat2

hisat2 --help

# subread

featureCounts --help

# multiqc

multiqc --help

# samtools

samtools --help

# salmon

salmon --help

# fastp

fastp –help

问题1:如何指定安装的软件的版本?

在不指定版本的情况下,conda 默认安装该软件的最新版。如果要安装旧版本:

1. 先看看有哪些可以安装的版本conda search fastqc

2. 安装指定版本的软件conda install fastqc=0.11.7

添加-y参数跳过确认步骤conda install -y fastqc=0.11.7

问题2:安装了这个软件包但是调用不了是怎么回事?

安装的软件包的名称和实际调用的程序不一定是同名的!

例如:我们安装的是subread,调用的是其软件包里的子程序featureCounts;

我们安装的是sra-tools,调用的是prefetch;

我们安装的是blast,调用的是blastp

三个特殊情况 trim_galore -> trim-galore

vep -> ensembl-vep

sratoolkit -> sra-tools

查看conda环境中已安装的软件

基本用法:conda list

查看当前环境所安装的软件

扩展用法:1.查看符合正则表达式的软件conda list fast*

2.查看指定的环境的软件conda list -n rna

删除软件

conda remove fastqc

想要删除特定环境下的特定软件,如何指定?

conda remove -n rna fastqc

不指定-n参数就得进入该环境之后才能进行删除操作,同样,-y能够跳过确认执行的步骤

Conda常用命令

补充

生信技能树学习笔记

前情提要:1.安装conda

2.配置镜像

# 创建R4环境

conda create -y -n R4 python=3.8

# 激活R4环境

conda activate R4

# (可选步骤:在R4里安装mamba)

# conda install mamba

# 安装R语言本体

conda install -y r-base=4.2

## 或者使用mamba安装:mamba install -y r-base=4.1.2

# 安装R语言软件包(安装命令可从Linux软件安装.md文件中查找)安装时间较久

conda install -y r-getopt r-tidyverse r-ggplot2=3.3.5 bioconductor-limma bioconductor-edger bioconductor-deseq2 bioconductor-clusterprofiler bioconductor-org.hs.eg.db=3.13.0

## 或者使用mamba安装:mamba install -y r-getopt r-tidyverse r-ggplot2=3.3.5 bioconductor-limma bioconductor-edger bioconductor-deseq2 bioconductor-clusterprofiler bioconductor-org.hs.eg.db=3.13.0

##最后这两个包可能比较难安装,如果尝试后安装不上,可以用R的方式安装:

1.在状态栏里输入R并回车

2.在R的交互框里输入install.packages("BiocManager")

3.输入BiocManager::install("org.Hs.eg.db")

Q: 如何验证R语言的包安装情况?

#激活R

conda activate R4

# 输入R进入R语言的交互

R

在R语言里验证安装包:

library(getopt)

library(tidyverse)

library(ggplot2)

library(limma)

library(edgeR)

library(DESeq2)

library(clusterProfiler)

library(org.Hs.eg.db)

Q: 如何知道这些包到底叫啥?哪儿该大写哪儿该小写?

A: [Bioconductor - Home](https://bioconductor.org/) 在Bioconductor的官网搜索即可。

最后这两个包可能比较难安装,如果尝试后安装不上,可以用R的方式安装,例如:

在状态栏里输入R并回车,并配置镜像

options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))) options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")

2.在R的交互框里输入: install.packages("BiocManager")

3.输入: BiocManager::install("org.Hs.eg.db")

最后

# 如果有mamba的话可以用mamba安装

# mamba env create -n rna -f rna.yaml

conda env create -n R4 -f R4.yaml

其他用法

卸更新软件:conda update 软件名

载软件:conda remove 软件名

删除环境:conda remove -n 环境名

克隆环境:conda create –n 新环境名 –clone 旧环境名

查找软件:conda search 软件名

查找软件常用的链接:

https://anaconda.org/search

https://bioconda.github.io/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
项目管理
CODING 项目管理(CODING Project Management,CODING-PM)工具包含迭代管理、需求管理、任务管理、缺陷管理、文件/wiki 等功能,适用于研发团队进行项目管理或敏捷开发实践。结合敏捷研发理念,帮助您对产品进行迭代规划,让每个迭代中的需求、任务、缺陷无障碍沟通流转, 让项目开发过程风险可控,达到可持续性快速迭代。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档