NCBI中SRA数据库简介

SRA数据库简介

S R A 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。

SRA 数据库的组织架构 

首先是项目编号,通常以PRJ开头,会记录该项目的一些背景信息,包括,研究的目的及意义,项目启动日期,作者单位信息等等,项目下面可以包含以下子内容: 

(1)研究内容(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或S R P 开头。  

(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。 

(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。 

(4) 数据信息,包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。  


SRA 数据库进入方法:在NCBI主页找到SRA就可以直接搜索了: https://www.ncbi.nlm.nih.gov/    

attachments-2018-11-vgUtZMAz5beadf3a3fee7.jpg

更多SRA数据下载: https://www.omicsclass.com/article/53 

高通量fastq测序数据查看: https://www.omicsclass.com/question/42 

 

  • 发表于 2018-11-13 22:31
  • 阅读 ( 13045 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

658 篇文章

作家榜 »

  1. omicsgene 658 文章
  2. 安生水 328 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. xun 68 文章
  8. rzx 67 文章