我运行你在有道笔记中的GEO数据库分析遇到问题?

attachments-2020-03-UzXxSOpw5e5cb02fa9935.png

我发现 DEG_list_kegg是1487行,而map_ids是1468行。

这个是得出DEG_list_kegg的代码,

degs一开始是1487行,去除没有entrezid的行后,为1468行

degs<-degs[!is.na(degs$entrezid),]   #去除没有entrezid的行   

#将字符转换成数字,注意一个基因有多个entrezid的情况,这里处理一下

DEG_list_kegg <- c()

for(i in degs$entrezid){

  DEG_list_kegg<-c(DEG_list_kegg,eval(parse(text = i)))

}

为什么这一步得出的DEG_list_kegg还是1487行?

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

这个是由于一个基因有多个 entrez ID 导致的:

下面的代码是把多个entreID取了并集,建议取一个作为代表序列;可以提前用Excel处理好基因信息文件表格;

DEG_list_kegg <- c()
for(i in degs$entrezid){
  DEG_list_kegg<-c(DEG_list_kegg,eval(parse(text = i)))
}
请先 登录 后评论
  • 1 关注
  • 0 收藏,2079 浏览
  • 小朱大夫 提出于 2020-03-02 15:13

相似问题