全基因组直系同源基因簇(Orthologousclusters)的分析是比较基因组学研究中的一项重要内容,直系同源基因簇之间的聚类及网络构建有助于解释跨多物种的蛋白质的功能和进化关系,今天小编给大家分享由西南大学生物学研究中心王翊教授开发一款用于多物种全基因组直系同源基因簇比较和注释的在线工具—OrthoVenn2,非常简单好用!
OrthoVenn2 是由西南大学生物学研究中心王翊教授开发,较之前版本OrthoVenn v 1.0版本,OrthoVenn2的性能、数据库、分析及结果展示方面都有很大的提升;OrthoVenn2基于OrthoMCL启发式匹配算法,用DIAMOND进行比对,比传统的BLAST算法速度提高了1万倍,OrthoVenn2基因组蛋白序列来源于Ensembl数据库,通用性更强,单次在线分析的上限物种数量提高了1倍达12个。OrthoVenn2还提供了本地版本下载,可以处理更大数据量的分析,无物种数限制,分析环境封装于docker镜像中,个人安装docker后直接下载OrthoVenn2镜像即可使用,还未安装docker或者不了解docker的朋友请点击链接学习:生信学习第一步!免费领取一套docker虚拟机!OrthoVenn2访问网址:https://orthovenn2.bioinfotoolkits.net/home。
OrthoVenn2的操作十分简单,打开主页后,各功能项介绍如下图。
点击Start即进入分析页面,如下图:可分析物种分为脊椎动物、植物、多细胞动物、原生生物、真菌、细菌六大类,点击下图圆形彩色物种目录即可进入下一级物种目录,选择物种后,右侧会展示所选物种列表;另一方面,该网站支持本地基因组蛋白质序列上传(fasta格式)。
任务提交后,系统会自动生成任务号,分析速度还是蛮快的,小编选了小麦、玉米、水稻三个物种,仅30分钟就分析完成,最终结果会以链接形式发送到预留的邮箱中,结果形式如下图:
OrthoVenn2的结果展示很是丰富,较OrthoVenn1版增加了不同物种同源基因簇的存在或者缺失情况的直观显示及统计信息(绿色表示存在,灰色表示缺失)还可以通过个性化展示功能区进行调整展示内容,以及设置图片颜色、字体等;页面右侧则统计了各物种基因组蛋白数、基因家族数目、单拷贝基因序列数目,其下方还可直接下载序列聚类信息表以及同源基因簇的相应的蛋白序列。最醒目的Venn图部分展示的是不同物种全基因组基因家族的交集信息,理解该Venn图,我们首先需要理解以下概念:我们常听说泛基因组(pan genome),是指某一物种全部基因的总称,但由于物种内也存在分化,所以并不是这个物种中所有个体的基因组成都是一样的,所以,泛基因组可分为三个部分:1. 核心基因组(core genome),即在所有个体中都存在的基因,该类基因非常保守;2. 非必须基因组(dispensable genome)是指存在于部分个体中的基因,与物种的分化有关,利于个体竞争;3. 特有基因(specific genes)是指只存在于某一个体中的基因,常与该个体的独特表型相关,如对特定环境的适应性或独特的抗病性等。
引申到跨物种比较基因组学中,该Venn图展示的是分别分布于核心基因组、非必须基因组以及特异基因中基因家族,如红框中的数字14410是3物种共有的核心基因家族;该Venn图共两种风格,还可以通过勾选增减物种数量重新绘制,Venn图下载见箭头所指,提供的图片格式包括PNG、PDF、SVG。Venn图中数字均可点击,打开后页面如下图,上方三个饼状图展示的是对应同源基因簇的GO功能类别的比例,包括生物过程(biological processes)、分子功能(molecular functions)和细胞成分(cellular components)3个层次的信息。饼图下方的列表中有基因簇蛋白数量、Swiss-Prot及GO(Gene Ontology)功能注释及富集分析的结果;右侧还可以下载基因家族聚类信息表以及该共有区域的相应序列,具体见下图标注信息。
点开上图的基因簇编号 Cluster-,可以看到该基因簇包含蛋白ID、基因家族的相似性网络图,该网络图中两条序列(节点)连线越粗,表示两基因相似度越高,并且网络图中连线和节点都可以拖动,可以根据自己审美及展示需求进行调整。左下方链接还可以进一步查看蛋白质序列、多重序列比对、motif分析以及进化树,详见上图标注信息。
OrthoVenn2支持在线或本地使用,无需注册,分析内容丰富、功能强大,是一款不可或缺的比较基因组学研究工具,分享给大家,希望能对您可研有所帮助!最后,提醒大家,原创不易,使用该工具发文章时记得引用文献出处,参考文献见下方。参考文献:
Ling Xu, Zhaobin Dong, Lu Fang, Yongjiang Luo, Zhaoyuan Wei, HailongGuo, Guoqing Zhang, Yong Q Gu, Devin Coleman-Derr, Qingyou Xia, Yi Wang. OrthoVenn2: a web server for whole-genome comparison and annotation oforthologous clusters across multiple species, Nucleic Acids Research, Volume 47, Issue W1, 02 July 2019, Pages W52–W58, https://doi.org/10.1093/nar/gkz333.
日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:
1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操
2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析
3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 ;转录组与代谢组结果解读/个性化数据分析 ;
4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操
3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析;动植物泛基因组分析 ;比较基因组分析
4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;
5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析
6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析
7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操
8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器
9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:
10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!