GEO数据库的搜索下载数据技巧

GEO数据库的搜索下载数据技巧

1、首先GEO数据库是个什么鬼呢?

GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。


2、那GEO数据库有哪些检索入口呢?

最常用的有两种方式,如果你知道GSE编号可以通过网址http://www.ncbi.nlm.nih.gov/geo直接进入,具体编号介绍文件下载方法见:https://www.omicsclass.com/article/1100


另外一种就是通过NCBI主页的入口基因搜索下载。通常是不知道GEO编号,通过样品类型,实验处理,平台信息等搜索筛选想要的GEO数据:https://www.ncbi.nlm.nih.gov/,进入NCBI主页,搜索数据选择GEO DataSets,如果搜索某个基因表达量可选择GEO Profiles。


attachments-2019-11-mua9rjbc5dc8fac1e6bc3.png


3、搜索方法技巧详细介绍


1)首先我们先来介绍一下数据库检索界面的基本信息:

和pubmed一样,GEO数据库界面主要包括检索框、检索结果列表、检索结果限定选项、检索记录信息,等(点开大图有惊喜),数据类型详解见:https://www.omicsclass.com/article/1100


attachments-2019-11-OTKtg6Di5dc8fe8743ce0.png

2)想要准确地找到需要的数据,限定条件很重要

限定数据记录类型:首先数据导入类型主要分为四种:datasets、series、samples和platforms,可根据自己的需要选择,最常用的是series数据集显示格式

attachments-2019-11-xJPLptIA5dc8ffb7182a8.png

限定检测平台类型:要注意的是不同的实验检测类型不一样,比如DNA、mRNA、SNP、甲基化等等,在检索时就要结合自己的实验设计选择相应的检测类型。

attachments-2019-11-YA0l6n8o5dc9000be7da8.png

限定作者:当想要检索某一个具体研究者发表的文章相应的数据资料时,就可以在这里ADD作者的名字来精确检索啦。

attachments-2019-11-vCHEjTWT5dc90001cc9a1.png

限定物种来源:在选择限定条件时,还有很重要的一项就是选择检测样本的物种来源,比如人、小鼠、家兔、犬等等

attachments-2019-11-vzxxuwbI5dc9002119d0d.png

限定样品类型:除了不同的物种外,如果想要查找某一层面基因表达的数据时,比如组织、细胞等等,在这里ADD想要的type就行。

attachments-2019-11-5pJigfDP5dc9002c97681.png

4、数据下载介绍

选中其中一个感性的标题点击:

attachments-2019-11-zS7ISlks5dc8ff863e3cb.png

之后得到数据介绍页面:

attachments-2019-11-Es70msAM5dc8ff9712280.png

数据介绍及下载详解见:https://www.omicsclass.com/article/1100

  • 发表于 2019-11-11 14:11
  • 阅读 ( 10017 )
  • 分类:GEO

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

654 篇文章

作家榜 »

  1. omicsgene 654 文章
  2. 安生水 325 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. rzx 67 文章
  8. xun 66 文章