医学癌症TCGA-生存分析课程相关问题-表达数据cpm计算log标准化后数据为什么变成了负值?

医学癌症TCGA-生存分析课程中基因表达数据处理时通过cmp对表达数据进行标准化处理

我分析的是mRNA的数据

运行下面代码,得到的数据如下图

norExpr <- DGEList(counts=datExpr)
norExpr <- calcNormFactors(norExpr)

attachments-2020-04-aWcefbmv5e9ac6dcd6921.png

运行下面的代码后,得到数据如下图

norExpr_cpm <- cpm(norExpr,prior.count=2, log=TRUE)

attachments-2020-04-mseqEodf5e9acabe51f29.png

cpm标准化后,数据中有很多是负值,这是不是有问题呀?因为课程里提到cpm计算后数值比较大,所以选择进行log进行数据标准化。

而且后续进行单因素cox回归分析时,运行到

# 将单因素的结果汇总,形成一个dataframe
Univar <- ldply(Univar, data.frame)

得不到结果。

请各位老师和同学指点迷津,十分感谢!



请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

表达量太低的话取log 可能出现负值的;

请先 登录 后评论
  • 2 关注
  • 0 收藏,5417 浏览
  • 安华英 提出于 2020-04-18 17:49

相似问题