NCBI上的genebank里应该可以提取出蛋白序列以及cds序列,不过过程很繁琐麻烦,初学者操作不了的。建议找找其他数据库有没有基因组。另外,找找基因组发表的文章,可以问作者要一下基因组的文件。一般作者都会提供给你的。
回答于 2020-05-04 10:59
如果计算差异的话,不同的物种得基于同一个参考,否则没有办法做。 只计算差异的话,有重复的DEseq就可以,没有重复的EBSeq。 另外,也可以使用FPKM算一下表达量,这就是一种归一化的方式。
回答于 2020-04-10 09:05
没有基因组的话,分析基因家族,就得以转录组构建的unigene库做为参考进行家族基因鉴定。方法和有基因组的是一样的,只是说有些分析内容做不了。如果有兴趣的话可以购买我们的课程,没有linux基础的话,建议同时学习一下linux这门课程: 基因家族 https://study.163.com/course/introduction/1209048893.htm?share=1&am...
回答于 2020-04-02 08:37
这是主要是由于你做转录组的材料和已测基因组的材料亲缘关系较远,有较大差别造成的。既然这个物种有多个参考基因组,可以让公司都给试试,看看哪个比对效率高用哪个。 另外,比对效率一般来说能有70以上就可以了,60也可以使用。太低的话就不行了。
回答于 2020-02-02 16:04
这个有多方面的原因, 1. 基因组测序,由于有大片段文库,能知道序列间的相互位置,预测的基因结构会准确好多 2. 无参转录组denovo 组装的话,就不行,一个基因,两个不同的转录本,如果差别比较大的话,组装软件就没办法认为是一个基因,而认为是两个 3. 同时,无参转录组denovo 组装的话,如果遇到重复序列,是无法...
回答于 2019-07-12 17:24