可以使用以下命令:
sed 's/_P/_T/' 蛋白质文件名 > new.name
最好确认一下有没有替换成功。
老师,我做基因家族分析
下面是蛋白ID
下面是cds序列
下面是gff文件
获取基因与mRNA的对应关系perl script/mRNAid_to_geneid.pl Arabidopsis_thaliana.TAIR10.41.gff3 mRNA2geneID.txt,提取到的ID=Zm00001d027240_T001,而在hmm搜索的结果ID=Zm00001d027240_P001,在去除重复的hmmer搜索的转录本ID时,ID不一致,同时hmm搜索的结果ID和cds序列里ID也不一致,无法提取cds序列