是正常的,泛基因集基因对筛选条件有两个,1是在syn.txt中有共线性关系;2是last.txt中相似度100的首次匹配。会对两个文件进行筛选并对结果取交集。最终得到可靠的结果output.txt。所以过程中会有结果被过滤掉
回答于 2025-09-24 21:14
后续分析用到的数据只有文件前两列。后面几列是第2列基因的相关注释信息,在后面分析中不影响也用不到
回答于 2025-09-24 15:26
这个看泛基因组数据文章有没有提供相关数据下载链接,没有的话只能自己去测所有相关品系样本的表达量。没有这部分数据的话这步是做不了的。但其它分析都是可以做的
回答于 2025-09-22 16:58
如果在CDD中结构不完整,可以看一下在hmmsearch或其它interpro\smart数据库中是不是能搜索到完整结构域。对于长度缺失严重的结构域结果,需要删除。但不同的基因家族它的删选条件不一样,有的基因家族会根据NC端的缺失划分为不同亚家族,这个要看具体的基因家族
回答于 2025-09-19 09:19
这里建议用全部的家族基因,包括私有基因去构树,更能说明泛基因家族的生物学问题。至于进化树分支分组,可以去参考该物种的GRAS家族分析文献
回答于 2025-09-17 10:20
软连接后面白字红底标记,表示没有设置成功,看你检查一下源文件是存在的。那应该是id.txt文件中每行品系拉丁名后存在非法字符(例如空格)。检查一下id.txt文件
回答于 2025-09-15 16:09
这个env.sh文件中带#的行是不需要改动的,也是不需要去定义这个变量的。没有带#的行是需要根据自己的物种进行更改的
回答于 2025-09-15 10:49