如何用R筛选出高表达的基因，低表达基因 - 组学大讲堂问答社区

如何用R筛选出高表达的基因，低表达基因

筛选基因

基因表达数据矩阵，输入数据截图：

代码部分：

myfpkm<-read.table("All_gene_fpkm.txt",header=TRUE,comment.char="",sep = "\t",check.names=FALSE,row.names=1)
head(myfpkm)
myfpkm[order(rowSums(myfpkm),decreasing=T)[1:5000],]  #筛选表达量高的前5000个基因
myfpkm[rowSums(myfpkm)>1,]  #筛选掉表达量低的基因

minRowFPKM=rowMeans(myfpkm)>2  #按平均数筛选
minNumFPKM=rowSums(myfpkm>0)>10 #表达量不为0的样品个数筛选
myfpkm=myfpkm[minRowFPKM & minNumFPKM,] #联合一下

代码理解不了，可观看《R语言快速入门与提高》视频课程有详细说明。

更多生物信息课程：

1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读

2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读

3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接：WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课：linux系统使用、perl入门到精通、perl语言高级、R语言画图，R语言快速入门与提高

7. 医学相关数据挖掘课程，不用做实验也能发文章：TCGA-差异基因分析、GEO芯片数据挖掘、 GEO芯片数据不同平台标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析

8.其他，二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读、

9.更多课程可点击：组学大讲堂视频课程

发表于 2018-05-03 18:31
阅读 ( 25667 )
分类：R

作家榜 »

omicsgene 754 文章
安生水 368 文章
Daitoue 167 文章
生物女学霸 120 文章
xun 95 文章
rzx 87 文章
红橙子 81 文章
Ti Amo 75 文章