wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
按y yes 回车等进行安装然后重新激活环境
source .bashrc
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
因为第一步下载的conda是北外的源配置镜像也用的北外的镜像 最好统一
conda config --set show_channel_urls yes这一步是搜索时显示通道地址
配置完成会默认进入base环境每一次都是 但是在数据分析过程中我们需要将每次下载的软件数据等创建新的小环境(最好是每做新的项目就创新的小环境不要在base中进行分析具体为什么是因为大家好像都这样做而且看的b站教程也是这么说具体没看)
因此可以用这串代码解决
conda config --set auto_activate_base false
https://blog.csdn.net/weixin_44159487/article/details/105620256 代码来源
conda create -n xxx
# xxx可以是所创建环境名eg:rna
输入y 回车
# 激活环境
conda activate rna
# 成功进入rna环境之中啦
# 退出环境
conda deactivate
# trinity也可以是别的只要是软件名即可 eg:sratoolskit 用于下载数据 这里我sratools 是官网用迅雷下载利用xftp上传就不写了
conda install -c bioconda trinity
下载好输入y 回车安装等等
安装好sratoolskit就可以进行下载了
prefetch SRRxxxxxx
在NCBI中找自己数据SRR号即可进行下载
1.fastq-dump --split-e --gzip ./SRRxxxxxx/SRRxxxxxx.sra # 将sra数据放在文件中的解压
2.fastq-dump --split-e SRRxxxxxx.sra # 在当前sra文件中的解压
# 两种方式只有路径区别自己看好文件路径即可
但是以上的代码是我网上找的是可以解压但是之后使用trinity一直在报错
可以看到error原因说找不到它提供了一串代码说让我这样解压
fastq-dump-defline-seq@$sn[_$rn]/$ri'--split-files file.sra
于是我重新解压数据(数据为双端测序 paired)
fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files --gzip ./SRRxxxxxx/SRRxxxxx.sra
# 会有两个文件输出SRRxxxxxx_1.fastq.gz SRRxxxxxx_2.fastq.gz
# 终于能正常运行了T_T
--gzip就是解压后数据是压缩形式 之后软件都可识别且节省空间
使用的是trinity conda下载的软件包中的 trimmomatic软件
去接头
nohup java -jar /下载的软件路径/trimmomatic.jar PE -threads 6 -phred33 -trimlog test.log SRRxxxxxx_1.fastq.gz SRRxxxxxx_2.fastq.gz SRRxxxxxx_1_1.fastq.gz SRRxxxxxx_1_2.fastq.gz SRRxxxxxx_2_1.fastq.gz SRRxxxxxx_2_2.fastq.gz HEADCROP:15 &
# 输出四个文件 SRRxxxxxx_1_1.fastq.gz SRRxxxxxx_1_2.fastq.gz SRRxxxxxx_2_1.fastq.gz SRRxxxxxx_2_2.fastq.gz
# SRRxxxxxx_1.fasta .gz SRRxxxxxx_2.fasta .gz 是输入文件
# SRRxxxxxx_1_1.fastq.gz .和SRRxxxxxx_2_1.fastq.gz .过滤之后的rna
# SRRxxxxxx_1_1.gz .和SRRxxxxxx_2_1.gz .过滤之后不要的
#其中 SRRxxxxxx_1_1.fastq.gz SRRxxxxxx_2_1.fastq.gz是之后需要用到的
nohup <命令> & 将运行进程挂后台可以不用一直开着电脑和终端退出也可以了
-threads 6 线程数6
HEADCROP:15 接头15个碱基去掉
其他trinity用法参数等参考
nohup Trinity --seqType fq --max_memory 50G --left SRRxxxxxx_1_1.fastq.gz --right SRRxxxxxx_2_1.fastq.gz --CPU 6 --output SRRxxxxxx-Trinity &
# --seqType fq必要参数
# --max_memory 50G最大运存
# --CPU 6线程数
# --output SRRxxxxxx-Trinity 输出文件名
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。