NCBI-SRA数据下载的3种方法

SRA 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的原始数据,来自四个测序平台,分别为:Roche_LS454,Illumina,ABI_SOLID和HELICOS。

从事生物信息分析的老师和同学一般都会接触SRA数据,下载SRA数据方法也有很多,这里来简单总结一下。

方法一:SRA Tookit下载

SRA Tookit 是NCBI 提供的下载软件,我们需要下载安装,下载地址:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

attachments-2019-08-Qf6RQuAI5d4bc4c61fd96.jpg

选择需要的SRA Tookit 版本进行下载,下载后直接解压到某个指定位置即可。然后搜索SRA数据,例如,我们要下载SRP108428(阅读文献可以找到公开数据的project号)下的所有数据,打开NCBI网址:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP108428(此处为project号),点击"Accession List"键,下载得到SRR List 储存在sra.txt文件中。attachments-2019-08-xRz28fsS5d4bc4f165701.jpg
得到sra.txt文件如下:

attachments-2019-08-sQgonD0N5d4bc504d3209.jpg
使用SRA Tookit 的prefetch进行下载,prefetch放在sratoolkit文件夹下的bin目录。

sratoolkit-centos_linux64/bin/prefetch --option-file sra.txt

方法二:迅雷下载

迅雷下载的方法我们之前介绍过,此方法可参考 更快更稳地下载NCBI里的测序数据 ,这里我就不赘述了。

方法三:wget下载

前两种方法都能够比较快速稳定的下载SRA数据,小编通常用的也是第二种方法,但是偶尔也会遇到一些特殊的数据是下载不了的。这时候就需要这第三种方法了。首先在NCBI首页的SRA数据库检索关键字:

attachments-2019-08-qyQutDs95d4bc54eb8fa5.jpg
选中符合要求的数据,然后点击send to,

attachments-2019-08-4E9N1ia25d4bc56c4fcf1.jpg
这样就会得到SraRunInfo.csv文件,文件内容是各个samp sequence的列表信息,包括FTP上的下载地址:

attachments-2019-08-F9jXjhK95d4bc5819acfa.jpg
然后我们在Linux中使用wget进行下载即可。好了今天先介绍到这里,你也动手去试试吧!



此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘

5. 微生物16S/ITS/18S分析原理及结果解读

6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:

https://study.omicsclass.com/



  • 发表于 2019-08-08 14:48
  • 阅读 ( 20030 )
  • 分类:软件工具

1 条评论

请先 登录 后评论
安生水
安生水

325 篇文章

作家榜 »

  1. omicsgene 654 文章
  2. 安生水 325 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. rzx 67 文章
  8. xun 66 文章