基因家族镜像里面安装了agat_sp_extract_sequences.pl 工具。使用命令行“agat_sp_extract_sequences.pl --gff Arabidopsis_thaliana.longest_isoform.gff3 --fasta Arabidopsis_thaliana.TAIR10.dna.toplevel.fa --output genes_with_utr.fa -t exon --merge” 可以提取所有转录本的外显子序列(cds+utr)
然后根据基因家族基因ID去提取对应序列就可以