前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一些生信工具的总结

一些生信工具的总结

作者头像
戈贝尔光和热
发布2018-12-27 15:16:40
8840
发布2018-12-27 15:16:40
举报
文章被收录于专栏:HUBU生信HUBU生信

1.数据下载软件 aspera,ubuntu下的下载方式为:

代码语言:javascript
复制
wget https://download.asperasoft.com/download/sw/conne ct/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz

之后,tar -zxvf进行解压,安装成功。

2.ncbi中SRA的ftp下载链接为: ftp://ftp.ncbi.nlm.nih.gov/sra/, SRA数据库的格式为:

代码语言:javascript
复制
ERP或SRP表示Studies
SRS表示Samples
SRX表示Experiments
SRR表示Runs;

在文献中,或者数据库中找到SRP/ERP/SRX/SRS/SRR这些序列号,(SRA数据库中存放的是测序原始数据),然后进入ftp进行下载,比如假设看见一篇文章的SRA数据库的一个序号:SRR6208854。 我们进入SRAftp进行数据下载,逐步定位到该序列:

可以看见这条序列的完整信息是大概有563MB。 如果用普通的ftp格式进行下载将会异常缓慢,所以我们采用aspera的fasp传输协议进行数据下载。 复制ftp的url:ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra

将其改为:

代码语言:javascript
复制
anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra

然后使用aspera进行下载:

代码语言:javascript
复制
 ~/.aspera/connect/bin/ascp -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh  anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra  ./

-T 不使用加密 -i 指定openssh(通用)

之后序列下载成功,这样原始序列我们就得到了。

如果需要批量下载数据的话,使用命令:

代码语言:javascript
复制
/.aspera/connect/bin/ascp -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh  --user=anonftp  --host=ftp-private.ncbi.nlm.nih.gov --mode=recv   --file-list  ~/1.sra  ./

user是使用者,NCBI的为anonftp,EBI的为era-fasp。 host是你需要链接的主机,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为 fasp.sra.ebi.ac.uk。 --file-list是你的文件列表 后面跟上你所需要下载的文件的列表 --mode=string 选择模式,上传为 send,下载为 recv(这个在有file-list时为必须的)


慢慢写,不着急

全文结束,欢迎在评论区讨论~

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018/11/08 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档