gff文件包含gene,cds,exon,mRNA的信息,但gene 和mRNA名称相同,不利于建立基因组索引,如何使用AWK命令批量只在mRNA的ID后面+.1?

例如:修改前

01EVMgene590510967.+.ID=GB_A01G0001;

A01EVMmRNA590510967.+.ID=GB_A01G0001;Parent=GB_A01G0001;

A01EVMCDS59056099.+0Parent=GB_A01G0001;


修改后:

01EVMgene590510967.+.ID=GB_A01G0001;

A01EVMmRNA590510967.+.ID=GB_A01G0001.1;Parent=GB_A01G0001;

A01EVMCDS59056099.+0Parent=GB_A01G0001;

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

建议学习学习 linux系统的使用,里面有基础命令AWK的讲解:https://bdtcd.xetslk.com/s/17gwqZ

请先 登录 后评论
  • 2 关注
  • 0 收藏,2401 浏览
  • Sirius 提出于 2020-11-13 14:45

相似问题