5 有关多个基因的聚类分析

我现在有600多条序列同时含有3个基因 我想利用这三个基因先聚类 然后建进化树分析 怎么同时进行这三个基因的联合聚类呢 cd-hit应该是用于单独一个基因的聚类把(ps: cd-hit聚类后我们通常是采用代表序列分析把  那3个基因分开聚类后 可能得到的代表序列是不一致的!所以很头疼) 有什么办法能解决这个问题吗? 能不能先多序列比对 然后连接三个基因序列 把他们修剪成同样的长度再进行cd-hit聚类。。。

请先 登录 后评论

3 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

建议三个基因先分别多序列比对,然后再拼接起来,再构建进化树;

因为分开比对,顺序打乱,如果想快速拼接建议写程序脚本完成,不然得自行手动完成;


请先 登录 后评论
鹅子

3基因按照固定的顺序拼接后,用MGEA不行吗?

请先 登录 后评论
周望笑

求大神来解答一下

请先 登录 后评论