对gff文件进行处理,保留注释信息中能编码蛋白的基因,上面的步骤没有发现问题。
得到的结果文件‘.protein_coding.gff3’是空的(上图和下图),是什么原因?应该怎么办?22个品系都出现了这个问题。
检查一下gff文件的格式是否标准,是不是9列。截图是格式有问题
上传到服务器中共22个品系,
(一)21个品系是gff压缩文件‘WNZ.gff.gz’,是从茶树泛基因组发表的文章链接中下载,其中WNZ的gff文件格式见下图
(二)另一个品系是压缩文件‘SCZ.gff3.gz’,是从茶树基因组网站下载,格式见下图