1天前 回答问题
可以手动编辑新文件,将${svgene}_gene.list手动设置2列,再运行cat ${svgene}_gene.list|while read -r gene sp; do grep "$gene" ../01.data_prepare/$sp.longest_isoform.gff3 >> ${svgene}.gff3;done
1天前 回答问题
默认情况下 grep 匹配的是包含子串 "WRKY14" 的内容,所以会同时匹配上WRKY140~WRKY149。可以修改命令grep "\b${svgene}\b" Fam_gene.list|sed "s/${svgene}\t//g"> ${svgene}_gene.list(添加单词边界 \b 限制匹配范围)
1天前 回答问题
检查一下原始泛基因组结构变异结果vcf文件all_merge.vcf,里面第5列ALT跟示例数据有区别。这列如果不能明确指出变异类型的话,可以根据截图中的变异位置去all_merge.vcf中找到具体变异类型
1天前 回答问题
检查一下每一个输入文件中是否有重复行。可以截图发一下
2025-09-29 13:42 回答问题
1. 检查输入文件;2 不需要的基因是指,一些基因在其他品系中不存在共线性的同源基因,例如私有基因,但是表达量文件中基因在这个品系中有表达量。这种表达量结果需要变为0
2025-09-29 13:26 回答问题
这个图用AI软件手动去画就行。具体变异类型可以根据基因ID去vcf里面查找,具体变异区域长度就是vcf中SVLEN参数
2025-09-28 16:17 回答问题
是根据with_SV和without_SV的平均值绘制的
2025-09-28 14:06 回答问题
这种情况可以都保留下来,继续分析
2025-09-28 13:43 回答问题
如果这3个基因是同一个品系的话是正常的。在泛基因列表文件中,这个品系中3个基因同时比对到一个泛基因ID上,这种情况可以只选择一个结果
2025-09-28 13:41 回答问题
正常,有的家族基因可能在部分品系中不存在