Uniprot蛋白数据库介绍及使用详解!

Uniprot数据库是资源最广、信息最丰富的蛋白质数据库,是查询蛋白功能的首选数据库。Uniprot数据库由Swiss-Prot、TrEMBL和PIR-PSD三大子数据库构成,数据主要来自于各物种基因组测序完成后得到...

Uniprot数据库是资源最广、信息最丰富的蛋白质数据库,是查询蛋白功能的首选数据库。Uniprot数据库由Swiss-Prot、TrEMBL和PIR-PSD三大子数据库构成,数据主要来自于各物种基因组测序完成后得到的全基因蛋白质序列,并包含了很多来自文献中的蛋白及其功能信息。尤其是swiss-prot 子数据库,库中蛋白质信息都是手工核对过的 ,非冗余, 有详细注释信息的蛋白数据。作为一名科研工作者,Uniprot数据库的使用技能应该是必备的技能之一。

Uniprot数据库简介

Uniprot 数据库包含蛋白质序列,功能信息,研究论文索引等信息,整合了包括EBI( European Bioinformatics Institute)、SIB(the Swiss Institute of Bioinformatics)、PIR(Protein Information Resource)三大数据库的资源。

EBI( European Bioinformatics Institute):

欧洲生物信息学研究所(EMBL-EBI)是欧洲生命科学旗舰实验室EMBL的一部分。位于英国剑桥欣克斯顿的惠康基因组校内,是世界上基因组学领域最强的存在之一。

SIB(the Swiss Institute of Bioinformatics):

瑞士日内瓦的SIB维护着ExPASy(专家蛋白质分析系统)服务器,这里包含有蛋白质组学工具和数据库的主要资源。

PIR(Protein Information Resource):

PIR是美国国家生物医学研究基金会(NBRF)于1984年创立,旨在协助研究人员识别和解释蛋白质序列信息。

Uniprot数据库主要子数据库组成:

attachments-2022-01-SRczBW3861e81e56464f1.jpg以上子数据库间的关系如下:uniprot会收集EMBL,GenBank,DDBJ等公共数据库中的蛋白质序列及功能信息等原始数据,处理后存入UniParc的非冗余蛋白质序列数据库;UniPrc作为数据仓库,再分别给UniProtKB,Proteomes,UNIRef提供可靠的数据集,其中在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库,也是我们最常用的蛋白质数据库之一。

attachments-2022-01-QRiCJpWl61e81e76a783e.jpg

Uniprot数据库官方链接:https://www.uniprot.org/

Uniprot数据的使用

1. 单个蛋白质信息查询

下图是Uniprot官方网站首页,在UniprotKB栏输入蛋白ID或Accession number,然后点击search,就可以查询蛋白功能。

attachments-2022-01-YGVtqCZl61e81ea429002.jpg我们以高粱基因SORBI_3008G150300为例,搜索其在Uniprot数据库中的信息,如下图,页面默认显示Entry模式,页面显示内容包括:蛋白名称、物种来源、GO功能注释、亚细胞定位、组织特异性表达情况、互作蛋白、Domain、序列信息、同源蛋白以及其他数据链接等信息。

attachments-2022-01-HAtC6ZbE61e81ec68d724.jpg点击Display下Publications模式,数据库会展示处该蛋白涉及的收录的文章。

attachments-2022-01-pPqll69v61e81ee500032.jpg点击Display下Feature viewer模式,数据库会图形展示结构域与序列信息。

attachments-2022-01-2dDAG7f161e81efe7e487.jpg点击Display下Feature table模式,数据库会展示结构域位置、分子量、序列长度等基本信息。

attachments-2022-01-KijgShqv61e81f1a7f8e4.jpg

2. 批量蛋白质信息查询

假如需要查询的蛋白较多,则可以通过点击首行任务栏Retrieve/ID mapping,如下图,查询蛋白列表可直接粘贴在下图1. Provide your identifiers文本框中,也可以将蛋白ID单列粘贴于TXT文本中提交到网站。另外该页面2. Select options 还可提供ID转换功能,支持多种数据库间的ID转换。

attachments-2022-01-mKDhEaLC61e81f326bf14.png

提交好蛋白列表后,点击Submit,网站便会自动分析,结果展现形式如下:

展示信息包括:蛋白对应的基因名、蛋白描述、序列长度等信息。

attachments-2022-01-zqK3YEEs61e81f5021de2.jpg点击Column按钮,可以选择需要展示的数据库信息,如GO、pathway、亚细胞定位等注释信息,如下图,选择完毕后点击save保存设置,系统会自动跳转至信息展示页面。

attachments-2022-01-XulEs2xj61e81f6abe869.jpg最终结果展示如下图,勾选感兴趣的蛋白,即可将本次注释结果下载到本地查看,并且支持包括Excel格式在内的多种文本格式。

attachments-2022-01-gFsdSvo961e81f8033147.jpg好了,今天Uniprot数据库的使用就介绍到这里,希望对您的科研有所帮助!

日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:

1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操 

2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析

3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 转录组与代谢组结果解读/个性化数据分析 ; 

4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操

3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析动植物泛基因组分析 ;比较基因组分析

4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;

5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析

6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析

7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操

8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器

9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:

点我开启学习之旅

10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习

  • 发表于 2022-01-19 22:26
  • 阅读 ( 38060 )
  • 分类:软件工具

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
红橙子
红橙子

81 篇文章

作家榜 »

  1. omicsgene 725 文章
  2. 安生水 360 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 88 文章
  6. rzx 85 文章
  7. 红橙子 81 文章
  8. CORNERSTONE 72 文章