GEO数据库dataset和profiles区别

GEOdataset

GEO Database

  近年来,利用高通量方法检测基因表达越来越普及,诸如微阵列杂交和基因表系列分析(SAGE)可以同时测量数以万计的基因转录脚本(gene transcript)。基因表达大棚车(GEOGene Expression Omnibus)则是归档和自由分发科研人员提交的高通量基因表达数据的公共仓库。目前,GEO存储了大约10亿单个基因表达的数据,来自于100多种生物,内容广泛涉及到各种生物学问题。这些大容量的数据可以使用用户友好的以Web为基础的工具进行有效的挖掘,检索和可视化表达。GEO的网址是www.ncbi.nih.gov/geo

结构

提交者提供的基因表达数据包括四个部分:

  • 平台:描述阵列的特性。例如,cDNA,寡聚核苷酸等等。
  • 样本:描述处理样本的生物学材料和实验条件,以及从中衍生的各种特点的大量检测。
  • 系列:定义被认为是一个实验的部分内容的一组相关样品。
  • 补充数据:原始微阵列扫描图或者粗糙的定量数据。

样本数据被组装到具有生物学意义并且可以比较的GEO数据集。数据集的记录提供关于实验的综合性的纲要,以此作为GEO数据表现和分析工具的基础。

数据挖掘

GEO中的数据可以通过两个NCBIEntrez数据库查询:

  1. Entrez GEODataSets从实验的角度组织GEO中的数据。感兴趣的实验可以通过查询属性(如自由文本的关键词,技术类型,作者,生物和实验变量信息)检索到,找到相关DataSet后,就可以利用在DataSet记录上的补充工具,进一步查找该实验中感兴趣的基因表达图谱。可以通过:www.ncbi.nih.gov/entrez/query.fcgi?db=gds登录。

GDS记录中可以使用的工具有

l  聚类热图:可选择系统聚类和K-means聚类算法,对于感兴趣的类别可以选定、扩大、下载、plotted as line charts或者将其直接链接到Entrez GEO-Profiles

l  两个查询结果的比较:该工具帮助找到在同一个DataSet中两个特定样本集之间标记出表达水平有差异的基因,差异计算采用T检验或者fold difference。符合用户定义标准的基因在Entrez GEO-Profiles中表达。

l  作用检索:检索到所有标记为对特定实验变量(如“年龄”或者“株”)有显著作用的图谱。

  1. Entrez GEOProfiles从基因的角度组织GEO中的数据,可以通过检索诸如基因名称,GenBank登录号,SAGE标签,GEO登录号,描述或者一些被标注上对特定的实验变量具有重要作用的图谱等属性,找到感兴趣的基因表达图谱(gene expression profile)。Entrez GEOProfiles可以通过:www.ncbi.nih.gov/entrez/query.fcgi?db=geo登录。

Entrez GEO-Profiles结果页面上可以使用的工具有

l  图谱邻居:返回在给定的DataSet中显示相似表达模式的一系列基因。

l  序列邻居:检索通过BLAST计算出来的在核酸序列上相似的相关图谱。

l  同源邻居:检索属于相同同源基因组(HomoloGene)的基因图谱。

l  链接:链接到其他NCBI Entrez 数据库,包括:GenBankPubMedGeneUniGeneOMIMHomologeneTaxonomySAGEMapMapviewer


转载:

http://blog.sciencenet.cn/blog-82196-42338.html


更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析GEO芯片数据挖掘 GEO芯片数据不同平台标准化 、GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他,二代测序转录组数据自主分析NCBI数据上传二代测序数据解读


  • 发表于 2018-10-28 06:58
  • 阅读 ( 3804 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

249 篇文章

作家榜 »

  1. omicsgene 249 文章
  2. 安生水 212 文章
  3. Daitoue 165 文章
  4. 生物女学霸 92 文章
  5. landy 37 文章
  6. 组学生物-王运斌 34 文章
  7. 红橙子 33 文章
  8. omics007 22 文章