10 对gff文件进行处理,保留注释信息中能编码蛋白的基因。得到的结果文件‘.protein_coding.gff3’是空的,应该怎么办。所有品系都出现了这个问题。

attachments-2026-04-OkC9GPuJ69f356c29c32c.png

attachments-2026-04-oeVic7oY69f3547bd10da.png

对gff文件进行处理,保留注释信息中能编码蛋白的基因,上面的步骤没有发现问题。

attachments-2026-04-82pB5sZE69f3548900f82.png

得到的结果文件‘.protein_coding.gff3’是空的(上图和下图),是什么原因?应该怎么办?22个品系都出现了这个问题。

attachments-2026-04-5TJN0KGQ69f354c9618a9.png

attachments-2026-04-6KdplcQW69f3552333bb1.png


请先 登录 后评论

3 个回答

rzx

检查一下gff文件的格式是否标准,是不是9列。截图是格式有问题

请先 登录 后评论
liping

上传到服务器中共22个品系,

(一)21个品系是gff压缩文件‘WNZ.gff.gz’,是从茶树泛基因组发表的文章链接中下载,其中WNZ的gff文件格式见下图

attachments-2026-04-Aw6XdvKM69f367b5bf54d.png

(二)另一个品系是压缩文件‘SCZ.gff3.gz’,是从茶树基因组网站下载,格式见下图

attachments-2026-04-swM4bl1369f367ca99d1e.png

请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

你要核对的是 : GFF文件格式没问题,以及核对第一列染色体ID和基因组文件染色体ID是否一致;
如果核对没有问题,你把当前文件夹文件清空之后再重新运行命令,AGAT检测到有输出文件存在会退出;

请先 登录 后评论