10 老师您好,我线下上过您的基因家族培训课程,目前在尝试用大豆基因组进行分析,但我发现从ENSEMBLEPLANT下载的基因组序列格式跟拟南芥的注释格式不一样,我已经尝试着进行了 一些编辑,但还是无法统一ID,麻烦您帮我解决一下这种基因组注释格式修改问题

下面这几个文件是从ensembleplant 网站下载的,Glycine_max.Glycine_max_v2.1.43.chr.gff3 ,  Glycine_max.Glycine_max_v2.1.cds.all.fa , Glycine_max.Glycine_max_v2.1.pep.all.fa ,格式信息如截图所示(我在基因家族培训QQ群里发布的那张图是我自己尝试编辑修改后的),期待您的帮助,非常感谢!attachments-2019-07-Gcc9mOm25d34075472a12.jpgattachments-2019-07-AsE103je5d34077374a31.jpg

attachments-2019-07-zKewF3b45d34078b58d7c.jpgattachments-2019-07-ACVBETeX5d3407ae11020.jpg

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

首先把 gene:等修改一下,然后根据下面生成的转录本ID与基因ID对应关系,通过excel 中Vlookup 查找对应关系;attachments-2019-07-zD32eSiU5d351ae0ade28.jpg




请先 登录 后评论
  • 1 关注
  • 0 收藏,4429 浏览
  • 提出于 2019-07-21 14:38

相似问题