请问,在基因组中提取包括UTR,CDS的基因序列,命令咋写?使得提取的UTR,CDS能自动拼接成一条序列。而且能一个命令出来的结果,能包含所有家族基因的UTR和CDS序列。

attachments-2025-07-dGrnOML2687b70fa6a35a.jpgattachments-2025-07-gZICVkjf687c549db2231.jpgattachments-2025-07-J2LbmKxE687c54b48350f.jpg

请先 登录 后评论

1 个回答

rzx

基因家族镜像里面安装了agat_sp_extract_sequences.pl 工具。使用命令行“agat_sp_extract_sequences.pl --gff Arabidopsis_thaliana.longest_isoform.gff3 --fasta Arabidopsis_thaliana.TAIR10.dna.toplevel.fa --output genes_with_utr.fa -t exon --merge” 可以提取所有转录本的外显子序列(cds+utr)

然后根据基因家族基因ID去提取对应序列就可以

请先 登录 后评论
  • 1 关注
  • 0 收藏,84 浏览
  • 如意 提出于 6天前

相似问题