我运行你在有道笔记中的GEO数据库分析遇到问题？

我发现 DEG_list_kegg是1487行，而map_ids是1468行。

这个是得出DEG_list_kegg的代码，

degs一开始是1487行，去除没有entrezid的行后，为1468行

degs<-degs[!is.na(degs$entrezid),] #去除没有entrezid的行

#将字符转换成数字，注意一个基因有多个entrezid的情况,这里处理一下

DEG_list_kegg <- c()

for(i in degs$entrezid){

DEG_list_kegg<-c(DEG_list_kegg,eval(parse(text = i)))

}

为什么这一步得出的DEG_list_kegg还是1487行？

默认排序时间排序

1 个回答

omicsgene - 生物信息 2020-03-02 19:53

擅长：重测序,遗传进化,转录组,GWAS

这个是由于一个基因有多个 entrez ID 导致的：

下面的代码是把多个entreID取了并集，建议取一个作为代表序列；可以提前用Excel处理好基因信息文件表格；

DEG_list_kegg <- c()
for(i in degs$entrezid){
  DEG_list_kegg<-c(DEG_list_kegg,eval(parse(text = i)))
}