这个是由于一个基因有多个 entrez ID 导致的: 下面的代码是把多个entreID取了并集,建议取一个作为代表序列;可以提前用Excel处理好基因信息文件表格; DEG_list_kegg <- c()for(i in degs$entrezid){ DEG_list_kegg<-c(DEG_list_kegg,eval(parse(text = i)))}
回答于 2020-03-02 19:53
这个涉及到基因组序列的批量注释,你可以把基因组上所有基因的序列到kegg数据库里面同源比对一下; 看看哪些基因比对到你感兴趣通路中就找到你想要的基因列表了;
回答于 2020-03-02 19:43
看你的命令行输入文件的名字不一样你检查一下: 输入文件有问题,你检查一下;你可以把输入文件和课程里面的文件内容对比一下; 我看不到你的输入文件,不好找原因。
回答于 2020-03-02 19:39
这个需要查阅文献,看看别人怎么在根据自己的研究目的选择数据的。再有,搜索到的数据要看数据背景信息,处理来源等等; 根据需要选择数据,而不是盲目的选择。最重要的还是多看文献。
回答于 2020-03-02 09:57
计算机基础知识得补补,科学计数法: 在电脑或计算器中一般用EXP或E(Exponential)来表示10的幂: 7.823E5=7823001.2e−4=0.00012 所以这个值:值最大是3e-10 不是很大,而是很小。
回答于 2020-03-02 09:54
小物种大多是没有 Gene symbol 的,有也是通过同源比对得到注释的Gene symbol。 少数有人详细研究过可能有给出名字;
回答于 2020-02-29 10:59