转录组中Count, TPM,FPKM如何计算

转录组中Count, TPM,FPKM如何计算


转录组数据分析中,进行基因表达定量获得的read count 数,是如何计算成TPM和FPKM的呢?参考《What the FPKM? A review of RNA-Seq expression units》这篇博客,

1. TPM 公式如下:

attachments-2018-12-iIEaDnEs5c0c82346411f.jpg

2. FPKM 公式如下:

attachments-2018-12-AVkuUNhZ5c0c82499abf0.jpg

3. TPM与FPKM的关系

attachments-2018-12-2IVpXVd05c0c82685c512.jpg


对应的R 代码如下:

countToTpm <- function(counts, effLen)
{
  rate <- log(counts) - log(effLen)
  denom <- log(sum(exp(rate)))
  exp(rate - denom + log(1e6))
}

countToFpkm <- function(counts, effLen)
{
  N <- sum(counts)
  exp( log(counts) + log(1e9) - log(effLen) - log(N) )
}

fpkmToTpm <- function(fpkm)
{
  exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
}

countToEffCounts <- function(counts, len, effLen)
{
  counts * (len / effLen)
}


如果您对转录组数据挖掘感兴趣的话,可以学习我的转录组分析和挖掘课程:

  1. 转录组标准分析后的数据挖掘
  2. RNAseq有参转录组数据自主分析
  • 发表于 2018-12-09 10:49
  • 阅读 ( 7911 )
  • 分类:转录组

0 条评论

请先 登录 后评论
microRNA
microRNA

116 篇文章

作家榜 »

  1. omicsgene 314 文章
  2. 安生水 216 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. CORNERSTONE 74 文章
  6. 红橙子 44 文章
  7. 生信老顽童 40 文章
  8. landy 37 文章