KEGG数据库应该是我们最常见的、使用频率最高的数据库之一了,它是一个整合了基因组、化学和系统功能信息的数据库。由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一。
在KEGG分析结果中,总还是有人分不清例如K01000和ko01000这样的编号的生物学意义,下面我给大家再介绍一遍:K01000:由大写K+五位数字组成,对应的是KEGG数据库中某类蛋白的编号,即某些基因注释到了该蛋白,该编号代表着这一类功能的蛋白,一个基因对应一个这种大K编号;ko01000:由小写的ko+五位数字组成,是pathway的编号,对应的是某一条代谢通路;一条通路里可以有多个基因共同参与调控,所以会存在多个大K编号,同样,一个基因也可以参与多个代谢通路所以一个基因也可以有多个ko注释,这下应该明白了吧!KEGG注释很是常见,几乎涉及到功能注释的项目都会有KEGG注释及富集分析,那么当我们找到某些感兴趣的基因或通路后,我们能不能仅用我们感兴趣的基因绘制漂亮的KEGG代谢通路图呢?就像下面这样的!当然,是我们自己做,而不是求助公司!答案是肯定的,今天小编就手把手教你自主绘制KEGG代谢通路图!
Pathview网页版简介:Pathview是一个通路可视化友好的R包,支持多组学数据映射(基因/蛋白-代谢),更重要的是Pathview还有一个网页版,这对于非生信人员真是重大好消息!
Pathview网页版具有如下优点:1. 图形界面很是友好,访问速度快。2. 有完整的通路分析流程,支持多组学数据整合分析,且数据库是最新的通路数据。3. 结果是交互式的,可以更深入了解数据。4. 可以游客身份登录也可免费注册,注册用户可以共享数据和保存分析历史。今天我们仅介绍Pathview绘制单一数据kegg通路图,下面进入正题:数据准备:我们以6个人的转录组数据为例,我感兴趣的是某一分组中与MAPK signaling pathway有关的基因,于是我从该组差异基因列表中筛选出目标基因及FPKM值整理如下表。
Pathview数据文件格式都是以tab或者逗号分隔的txt或者csv文件,EXCEL数据可以通过另存为(制表符分隔)TXT文件格式,如下:
数据提交与选项设置:如下图:点击New Analysis进入分析页面,首先在input&output下提交数据,Gene Data项选择文件上传数据。
数据上传完页面会自动跳出样本分组对话框,如下图:箭头处填写样本顺序号,并用逗号隔开即可分组,完成后点击Close关闭对话框。
接下来就是选择参考基因及数据类型等,参考基因选择人类参考基因组,转录组分析时参考基因组来源于ensembl,所以基因ID类型选择ENSEMBL,其他数据按实际情况自行选择即可。
需要注意的是步骤③,Manual选项下,可以手动选择感兴趣的通路,此处也可以选择Auto,数据库会自动给出能注释到的所有通路结果。步骤④在左侧选择感兴趣的通路,选中,点击⑤即可添加到右侧。选项Graphics,即图形参数,无特殊需求可默认;选项Coloration是颜色设置,可按需调整。
以上操作完成点击Submit提交任务。结果展示:Pathview绘图速度很快,如下图,绘制完成后,进度条位置便会出现结果查看链接。
下图是生成的MAPK signaling pathway注释结果,点击链接即可查看绘图:
绘制的KEGG注释图是可交互式的,每个带颜色的term都带有超链接,可点击它们转到更详细的解释,如下图:
下载绘图结果点击下方位置所示,下载结果中有PNG格式图片及keggID与基因ID对应文件。
这样,重新绘制的部分基因kegg注释图就做完了,是不是很简单?Pathview支持上百种有参物种,适用性很广,感兴趣的话赶紧试一下吧!Pathview网站地址:https://pathview.uncc.edu/时值618购物节,一定要让自己更美丽、更健康还有更有知识!逛完淘宝、京东,一定要逛逛组学大讲堂!知识无价!课程却有大额优惠在等你!
截止到今天,组学大讲堂共计发布30+门生物信息视频教程,涵盖数据结果解读、转录调控、基因家族、癌症数据库挖掘、微生物研究、编程语言(Python、R、Perl)等方向,学员数量22000+!多门课程被推送到网易首页推荐位,并被网易官方评为平台潜力奖,我们也是唯一入选的生物信息类团队!
课程链接如下,趁着618大促抓紧下手吧:
日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:
1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操
2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析
3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 ;转录组与代谢组结果解读/个性化数据分析 ;
4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操
3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析;动植物泛基因组分析 ;比较基因组分析
4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;
5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析
6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析
7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操
8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器
9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:
10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!