#保留蛋白编码基因

mkdir 16.GeMoMa
cd 16.GeMoMa

#保留蛋白编码基因

nohup agat_sp_filter_feature_by_attribute_value.pl --gff  $database/homo_protein/ath.gff.gz --attribute biotype --value protein_coding -t '!' -o Arabidopsis_thaliana.protein_coding.gff3 &

gff3文件中没有-biotype 和protein_coding ,如何保留蛋白编码基因,这个命令就不能用了吗

请先 登录 后评论

1 个回答

Ti Amo

就跳过这一条,用$database/homo_protein/ath.gff.gz 作为下一条的输入文件。
不确定到底能否使用,可以尝试运行这一条,如果
 Arabidopsis_thaliana.protein_coding.gff3文件为空或者过小,可以放弃这条过滤。
另外,过滤的话可以考虑根据第二列的source进行筛选,删除其他软件得到的非编码rna或者重复序列的信息。

请先 登录 后评论