Uniprot数据库是资源最广、信息最丰富的蛋白质数据库,是查询蛋白功能的首选数据库。Uniprot数据库由Swiss-Prot、TrEMBL和PIR-PSD三大子数据库构成,数据主要来自于各物种基因组测序完成后得到的全基因蛋白质序列,并包含了很多来自文献中的蛋白及其功能信息。尤其是swiss-prot 子数据库,库中蛋白质信息都是手工核对过的 ,非冗余, 有详细注释信息的蛋白数据。作为一名科研工作者,Uniprot数据库的使用技能应该是必备的技能之一。
Uniprot 数据库包含蛋白质序列,功能信息,研究论文索引等信息,整合了包括EBI( European Bioinformatics Institute)、SIB(the Swiss Institute of Bioinformatics)、PIR(Protein Information Resource)三大数据库的资源。
EBI( European Bioinformatics Institute):
欧洲生物信息学研究所(EMBL-EBI)是欧洲生命科学旗舰实验室EMBL的一部分。位于英国剑桥欣克斯顿的惠康基因组校内,是世界上基因组学领域最强的存在之一。
SIB(the Swiss Institute of Bioinformatics):
瑞士日内瓦的SIB维护着ExPASy(专家蛋白质分析系统)服务器,这里包含有蛋白质组学工具和数据库的主要资源。
PIR(Protein Information Resource):
PIR是美国国家生物医学研究基金会(NBRF)于1984年创立,旨在协助研究人员识别和解释蛋白质序列信息。
Uniprot数据库主要子数据库组成:
以上子数据库间的关系如下:uniprot会收集EMBL,GenBank,DDBJ等公共数据库中的蛋白质序列及功能信息等原始数据,处理后存入UniParc的非冗余蛋白质序列数据库;UniPrc作为数据仓库,再分别给UniProtKB,Proteomes,UNIRef提供可靠的数据集,其中在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库,也是我们最常用的蛋白质数据库之一。
Uniprot数据库官方链接:https://www.uniprot.org/
1. 单个蛋白质信息查询
下图是Uniprot官方网站首页,在UniprotKB栏输入蛋白ID或Accession number,然后点击search,就可以查询蛋白功能。
我们以高粱基因SORBI_3008G150300为例,搜索其在Uniprot数据库中的信息,如下图,页面默认显示Entry模式,页面显示内容包括:蛋白名称、物种来源、GO功能注释、亚细胞定位、组织特异性表达情况、互作蛋白、Domain、序列信息、同源蛋白以及其他数据链接等信息。
点击Display下Publications模式,数据库会展示处该蛋白涉及的收录的文章。
点击Display下Feature viewer模式,数据库会图形展示结构域与序列信息。
点击Display下Feature table模式,数据库会展示结构域位置、分子量、序列长度等基本信息。
2. 批量蛋白质信息查询
假如需要查询的蛋白较多,则可以通过点击首行任务栏Retrieve/ID mapping,如下图,查询蛋白列表可直接粘贴在下图1. Provide your identifiers文本框中,也可以将蛋白ID单列粘贴于TXT文本中提交到网站。另外该页面2. Select options 还可提供ID转换功能,支持多种数据库间的ID转换。
提交好蛋白列表后,点击Submit,网站便会自动分析,结果展现形式如下:
展示信息包括:蛋白对应的基因名、蛋白描述、序列长度等信息。
点击Column按钮,可以选择需要展示的数据库信息,如GO、pathway、亚细胞定位等注释信息,如下图,选择完毕后点击save保存设置,系统会自动跳转至信息展示页面。
最终结果展示如下图,勾选感兴趣的蛋白,即可将本次注释结果下载到本地查看,并且支持包括Excel格式在内的多种文本格式。
好了,今天Uniprot数据库的使用就介绍到这里,希望对您的科研有所帮助!
日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:
1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操
2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析
3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 ;转录组与代谢组结果解读/个性化数据分析 ;
4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操
3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析;动植物泛基因组分析 ;比较基因组分析
4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;
5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析
6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析
7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操
8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器
9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:
10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!