选感兴趣的基因,非编程自行绘制KEGG代谢通路注释图-简单易上手!

KEGG数据库应该是我们最常见的、使用频率最高的数据库之一了,它是一个整合了基因组、化学和系统功能信息的数据库。由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的...

KEGG数据库应该是我们最常见的、使用频率最高的数据库之一了,它是一个整合了基因组、化学和系统功能信息的数据库。由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一。

attachments-2020-06-UOYR3NXI5ee0ea069a299.jpg

在KEGG分析结果中,总还是有人分不清例如K01000和ko01000这样的编号的生物学意义,下面我给大家再介绍一遍:K01000:由大写K+五位数字组成,对应的是KEGG数据库中某类蛋白的编号,即某些基因注释到了该蛋白,该编号代表着这一类功能的蛋白,一个基因对应一个这种大K编号;ko01000:由小写的ko+五位数字组成,是pathway的编号,对应的是某一条代谢通路;一条通路里可以有多个基因共同参与调控,所以会存在多个大K编号,同样,一个基因也可以参与多个代谢通路所以一个基因也可以有多个ko注释,这下应该明白了吧!KEGG注释很是常见,几乎涉及到功能注释的项目都会有KEGG注释及富集分析,那么当我们找到某些感兴趣的基因或通路后,我们能不能仅用我们感兴趣的基因绘制漂亮的KEGG代谢通路图呢?就像下面这样的!当然,是我们自己做,而不是求助公司!答案是肯定的,今天小编就手把手教你自主绘制KEGG代谢通路图!

attachments-2020-06-3QBrdY8v5ee0ea185f3c5.jpg

Pathview网页版简介:Pathview是一个通路可视化友好的R包,支持多组学数据映射(基因/蛋白-代谢),更重要的是Pathview还有一个网页版,这对于非生信人员真是重大好消息!

attachments-2020-06-lCO259LW5ee0ea6098579.jpg

Pathview网页版具有如下优点:1. 图形界面很是友好,访问速度快。2. 有完整的通路分析流程,支持多组学数据整合分析,且数据库是最新的通路数据。3. 结果是交互式的,可以更深入了解数据。4. 可以游客身份登录也可免费注册,注册用户可以共享数据和保存分析历史。今天我们仅介绍Pathview绘制单一数据kegg通路图,下面进入正题:数据准备:我们以6个人的转录组数据为例,我感兴趣的是某一分组中与MAPK signaling pathway有关的基因,于是我从该组差异基因列表中筛选出目标基因及FPKM值整理如下表。

attachments-2020-06-l0fOQkS45ee0ea6e9f99a.jpgPathview数据文件格式都是以tab或者逗号分隔的txt或者csv文件,EXCEL数据可以通过另存为(制表符分隔)TXT文件格式,如下:

attachments-2020-06-L3G1Dex85ee0ea82c376c.jpg

数据提交与选项设置:如下图:点击New Analysis进入分析页面,首先在input&output下提交数据,Gene Data项选择文件上传数据。

attachments-2020-06-TSdylAJs5ee0eaa43ea73.jpg数据上传完页面会自动跳出样本分组对话框,如下图:箭头处填写样本顺序号,并用逗号隔开即可分组,完成后点击Close关闭对话框。

attachments-2020-06-VeMarpbQ5ee0eabcc5ccb.jpg接下来就是选择参考基因及数据类型等,参考基因选择人类参考基因组,转录组分析时参考基因组来源于ensembl,所以基因ID类型选择ENSEMBL,其他数据按实际情况自行选择即可。

attachments-2020-06-gDKxYBz45ee0eadade107.jpg

需要注意的是步骤③,Manual选项下,可以手动选择感兴趣的通路,此处也可以选择Auto,数据库会自动给出能注释到的所有通路结果。步骤④在左侧选择感兴趣的通路,选中,点击⑤即可添加到右侧。选项Graphics,即图形参数,无特殊需求可默认;选项Coloration是颜色设置,可按需调整。

attachments-2020-06-VtDD8tK85ee0eaf56ea00.jpg

以上操作完成点击Submit提交任务。结果展示:Pathview绘图速度很快,如下图,绘制完成后,进度条位置便会出现结果查看链接。

attachments-2020-06-RcWxwCdb5ee0eb0a0c941.jpg下图是生成的MAPK signaling pathway注释结果,点击链接即可查看绘图:

attachments-2020-06-Pd9sbHpF5ee0eb25cd7e2.jpgattachments-2020-06-HzlTPo725ee0eb2e50d3b.jpg绘制的KEGG注释图是可交互式的,每个带颜色的term都带有超链接,可点击它们转到更详细的解释,如下图:

attachments-2020-06-UbNJDAXp5ee0eb4f66b6d.png下载绘图结果点击下方位置所示,下载结果中有PNG格式图片及keggID与基因ID对应文件。

attachments-2020-06-jkxcoaBG5ee0eb66924aa.png

这样,重新绘制的部分基因kegg注释图就做完了,是不是很简单?Pathview支持上百种有参物种,适用性很广,感兴趣的话赶紧试一下吧!Pathview网站地址:https://pathview.uncc.edu/时值618购物节,一定要让自己更美丽、更健康还有更有知识!逛完淘宝、京东,一定要逛逛组学大讲堂!知识无价!课程却有大额优惠在等你
截止到今天,组学大讲堂共计发布30+门生物信息视频教程,涵盖数据结果解读、转录调控、基因家族、癌症数据库挖掘、微生物研究、编程语言(Python、R、Perl)等方向,学员数量22000+!多门课程被推送到网易首页推荐位,并被网易官方评为平台潜力奖,我们也是唯一入选的生物信息类团队!

课程链接如下,趁着618大促抓紧下手吧:

日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:

1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操 

2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析

3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 转录组与代谢组结果解读/个性化数据分析 ; 

4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操

3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析动植物泛基因组分析 ;比较基因组分析

4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;

5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析

6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析

7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操

8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器

9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:

点我开启学习之旅

10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习

  • 发表于 2020-06-10 22:23
  • 阅读 ( 6597 )
  • 分类:科研作图

0 条评论

请先 登录 后评论
红橙子
红橙子

81 篇文章

作家榜 »

  1. omicsgene 722 文章
  2. 安生水 360 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 88 文章
  6. rzx 85 文章
  7. 红橙子 81 文章
  8. CORNERSTONE 72 文章