背景
博耘生物说:
速铂Aspera是一套商业的高速文件传输解决方案,随着高通量数据的大量产生,从而对于大文件快速传输的需求,开始应用到生物领域,目前 NCBI、EBI 的 SRA 库都提供这样的服务。
…
一句话,远距离,大文件,Aspera 优势巨大。
我说:
你如果经历过使用 wget
下载 sra 数据要等几天几个星期,还可能断掉,就知道用下面这个黑科技有多爽了。
安装 aspera-connect:
1 2 3 4 5 6 7 8 9 10 11 12
| $ uname -a *x86_64*
$ wget http://download.asperasoft.com/download/sw/connect/3.6.0/aspera-connect-3.6.0.106805-linux-64.tar.gz
$ gunzip aspera-connect-3.6.0.106805-linux-64.tar.gz $ tar -xvf aspera-connect-3.6.0.106805-linux-64.tar
$ sh aspera-connect-3.6.0.106805-linux-64.sh
|
安装输出结果
1 2 3 4 5 6
| Installing Aspera Connect
Deploying Aspera Connect (/home/your_user_name/.aspera/connect) for the current user only. Restart firefox manually to load the Aspera Connect plug-in
Install complete.
|
修改环境变量
1 2 3 4 5 6 7
| $ vi ~/.bash_profile
export PATH=/home/your_user_name/.aspera/connect/bin:$PATH
$ source ~/.bash_profile
|
配置参数,测试下载
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
| ~/.aspera/connect/etc/asperaweb_id_dsa.openssh
$ ascp -i asperaweb_id_dsa.openssh --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list sra_list.txt -k 1 -QT -l 200m /path_to_save_download/
Usage: ascp [OPTION] SRC... DEST SRC to DEST, or multiple SRC to DEST dir SRC, DEST format: [[user@]host:]PATH -h,--help Display usage -A,--version Display version. -i PRIVATE-KEY-FILE Private-key file name (id_rsa) --mode=MODE MODE: send, recv --host=HOSTNAME --user=USERNAME --file-list=FILENAME File with list of sources -k RESUME-LEVEL Resume criterion: 0,3,2,1 -l MAX-RATE Max transfer rate -q Disable progress display -T Disable encryption
|
获取下载文件地址
一个 sra_list.txt
例子:
1
| /sra/sra-instant/reads/ByRun/sra/ERR/ERR009/ERR009428/ERR009428.sra
|
如何获取此地址:
找到 sra
文件的页面(发表的文章一般会提供这个页面的 ID),点击红框进入下一页
地址栏里显示了地址,然后按照上文的 sra_list.txt
模式编写
OS X 如何使用?
在 OS X 下,可以直接从官网下载 dmg 的安装包。安装之后,注意:
1 2 3 4 5
| /Users/your_user_name/Applications/Aspera\ Connect.app/Contents/Resources/ascp
/Users/your_user_name/Applications/Aspera\ Connect.app/Contents/Resources/asperaweb_id_dsa.openssh
|
其他上述参数沿用。
最后,请欣赏华丽丽的下载速度。