rzx 的回答 - 组学大讲堂问答社区

0 赞同

泛基因家族分析-SV和基因表达量

不对，文件有问题，检查一下输入文件

回答于 2025-09-28 09:11

0 赞同

是正常的，泛基因集基因对筛选条件有两个，1是在syn.txt中有共线性关系；2是last.txt中相似度100的首次匹配。会对两个文件进行筛选并对结果取交集。最终得到可靠的结果output.txt。所以过程中会有结果被过滤掉

回答于 2025-09-24 21:14

0 赞同

后续分析用到的数据只有文件前两列。后面几列是第2列基因的相关注释信息，在后面分析中不影响也用不到

回答于 2025-09-24 15:26

0 赞同

关于课程里面没有的分析内容，可以咨询当初添加的课程助教老师

回答于 2025-09-24 13:19

0 赞同

这个看泛基因组数据文章有没有提供相关数据下载链接，没有的话只能自己去测所有相关品系样本的表达量。没有这部分数据的话这步是做不了的。但其它分析都是可以做的

回答于 2025-09-22 16:58

0 赞同

不影响的，重要的是SUPP_VCF内容

回答于 2025-09-22 15:39

0 赞同

如果在CDD中结构不完整，可以看一下在hmmsearch或其它interpro\smart数据库中是不是能搜索到完整结构域。对于长度缺失严重的结构域结果，需要删除。但不同的基因家族它的删选条件不一样，有的基因家族会根据NC端的缺失划分为不同亚家族，这个要看具体的基因家族

回答于 2025-09-19 09:19

0 赞同

这里建议用全部的家族基因，包括私有基因去构树，更能说明泛基因家族的生物学问题。至于进化树分支分组，可以去参考该物种的GRAS家族分析文献

回答于 2025-09-17 10:20

0 赞同

软连接后面白字红底标记，表示没有设置成功，看你检查一下源文件是存在的。那应该是id.txt文件中每行品系拉丁名后存在非法字符（例如空格）。检查一下id.txt文件

回答于 2025-09-15 16:09

0 赞同

这个env.sh文件中带#的行是不需要改动的，也是不需要去定义这个变量的。没有带#的行是需要根据自己的物种进行更改的

回答于 2025-09-15 10:49