Phytozome通过端口批量下载文件
Phytozome官网提供了四种数据下载方式,前三种为网页操作模式,在此不多介绍,在此主要介绍第四种官方manualDownload with CartDownload with web UIDownload with Globus serviceDownload with APIDownload with API1. 登陆账号curl 'https://signon.jgi.doe.gov/si
Phytozome官网提供了四种数据下载方式,前三种为网页操作模式,在此不多介绍,在此主要介绍第四种
官方manual
- Download with Cart
- Download with web UI
- Download with Globus service
- Download with API
Download with API
1. 登陆账号
curl 'https://signon.jgi.doe.gov/signon/create' --data-urlencode 'login=USER_NAME' --data-urlencode 'password=USER_PASSWORD' -c cookies > /dev/null
- login=USER_NAME 为注册的邮箱账号
- password=USER_PASSWORD 为密码
2.下载所有文件的列表
curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get-directory?organism=PhytozomeV12' -b cookies > files.xml
- 获得一个包含所有PhytozomeV12中文件的xml文件
3. 下载文件
files.xml文件里记录每个文件的大小、存放路径、md5、类型等
比如下面记录的是拟南芥的cds序列文件,其中的url=" “中的内容提取出来,”&“替换为”&",前面加上网站https://genome.jgi.doe.gov,用curl下载(记得指定cookie文件)。
<file label=“PhytozomeV12” filename=“Athaliana_167_TAIR10.cds_primaryTranscriptOnly.fa.gz” size=“10 MB” sizeInBytes=“11041833” timestamp=“Wed Jan 08 16:38:08 PST 2014” url="/portal/ext-api/downloads/get_tape_file?blocking=true&url=/PhytozomeV12/download/_JAMO/585474407ded5e78cff8c47a/Athaliana_167_TAIR10.cds_primaryTranscriptOnly.fa.gz" project="" library="" md5=“6085fd39ad3327c727838f9da4f4b222” fileType=“Assembly” />
curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get_tape_file?blocking=true&url=/PhytozomeV12/download/_JAMO/585474407ded5e78cff8c47a/Athaliana_167_TAIR10.cds_primaryTranscriptOnly.fa.gz' -b cookies > Athaliana_167_TAIR10.cds_primaryTranscriptOnly.fa.gz
更多推荐
所有评论(0)