CNCB(China National Center for Bioinformation,国家生物信息中心),对标的NCBI,对国内研究者来说,数据上传跟下载方便的多,现在国内越来越多的数据都上传到该数据库。
该数据库有自主开发的下载软件Edge turbo客户端主要包含两部分:linux 命令行工具和 edgeturbo service。命令行工具为用户提供了简洁的命令行语法,用户可以快速上手以体验传输服务。edgeturbo service 是传输核心组件,它提供了具体的传输能力,用户不需要关
如果需要官方的说明文档可以在公众号留言,我会及时发给大家。
Linux 内核版本 :3.10.0 及以上,推荐使用 4.15 以上的版本;
操作系统版本 :CentOS7.2 及以上、Ubuntu 14 及以上,以及其它满足上述内核版本要求的主流 linux 操作系统版本;
硬件:64 位 CPU、2G 以上内存,推荐 4G 以上内存
网络:有外网访问权限,防火墙对 UDP 报文无限制
在linux终端上输入以下命令进行下载软件
wget https://ngdc.cncb.ac.cn/ettrans/download/edgeturbo-client.linux.latest.cncb.tar.gz
tar -zxvf edgeturbo-client.linux.latest.cncb.tar.gz
建议在自己的家目录下进行解压,解压后会在当前目录下增 加 edgeturbo- client 目录,此目录中包括以下内容:
edgeturbo
/lib
/script
serv_edgeturbo
为方便运行命令行工具,建议用户在环境变量中配置命令行工具的运行路径。以 bash 为例,在.bashrc 文件中添加如下配置:
vi ~/.bashrc
# 按英文i 将下面命令行鼠标右键复制进文件中
export PATH="$HOME/edgeturbo-client:$PATH"
#保存退出 按esc 输入:wq进行保存退出
保存退出以后运行(如果你不擅长Linux操作,不会使用上面的vi命令,也可以全路径使用这个软件,不添加环境变量哈)
source ~/.bashrc
如果已经配置了PATH变量可以直接输入以下命令
edgeturbo start
edgeturbo start
edgeturbo restart
edgeturbo stop
edgeturbo download /gsa/CRA007099/CRR511439/CRR511439_f1.fq.gz
edgeturbo dl /gsa/CRA007099/CRR511439/CRR511439_f1.fq.gz
edgeturbo dl /gsa/CRA007099/CRR511439/CRR511439_f1.fq.gz L/home/data
image.png
edgeturbo rm 0aee040d943e
edgeturbo rm
edgeturbo ps
或者edgeturbo
edgeturbo set /home/lnjoying/mydownload
edgeturbo help
上面举例的样品是:
https://download.cncb.ac.cn/gsa/CRA007099/CRR511439/CRR511439_f1.fq.gz
https://download.cncb.ac.cn/gsa/CRA007099/CRR511439/CRR511439_r2.fq.gz
所以我们的构建的(edgeturbo download )下载命令是:
edgeturbo download /gsa/CRA007099/CRR511439/CRR511439_f1.fq.gz
把前缀去掉即可。但是我自己普通的 axel -n 20 下载也是类似的网络速度,一整天的时间可以下载360G的文件: