老师,请教一个问题:
(1)我通过基因家族分析课程19课时的方法,从NCBI下载已知Human 目标基因蛋白序列,获得了XXX.fa 文件。提交到了NCBI-CD-search,获得了如下结果(图一);提交到Pfam数据库,获得了图二暂未出结果(图二);提交到SMART数据库,得到了图三所示结果(图三)。
图一
图二
图三
在CD-search 里面,Incomplete出现N/C/NC端不完整的片段,是直接从XXXX.fa里面删除整条ID序列吗? 完成三大数据库的比对后,在hmmsearch第一次搜素结构域时,我的如何对接上?
老师,您误会了。因为我的目标物种没有pfam号,所以我用已知人类的蛋白序列建立种子序列,分析结果如上所示。通过前期的文献积累,比对结果符合该基因家族的特征。
目前的主要困惑是:(1)在CD-search 里面,Incomplete出现N/C/NC端不完整的片段,是直接从XXXX.fa里面删除整条ID对应的序列还是保留分析?(2)在完成三大数据库的比对后,在hmmsearch第一次搜素结构域时,我如何利用比对结果建立物种特异hmm模型?
人类的基因 基因家族基因都是明确的你直接查询就行了;不用鉴定
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!