AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
利用subset针对数据框按照条件进行判断和筛选数据
在R中利用split,借助数据的分类类型,对数据进行分组
Bio-Linux中有很多安装的生物信息学软件,这里给大家列举一下:
PCA(principal component analysis )主成分分析,可以分析样品之间相关性,确定样品总体上的差异,或者查看是否有批次效应等
1.安装zlib1.2.5版本及以上 cd zlib-1.2.11 ./configure --prefix =/share/work/biosoft/zlib make make install 2.安装bzip cd bzip2-1.0.6 make -f Makefile-libbz...
采用R包STRINGdb 来进行蛋白互作网络分析
Igraph软件安装错误
生信分析是用的 .xls 文件 大多是文本格式的文件,是可以被Perl读取的,但遇到真的excel文件时,就不行了,这时候就需要使用模块 使用的模块为: Spreadsheet::ParseExcel Spreadsheet::Writ...
对数据中存在的NA情况进行处理,替换或者删除
转录组分析常用数据库
ls命令是linux下最常用的命令。ls命令就是list的缩写,缺省下ls用来打印出当前目录的清单,如果ls指定其他目录,那么就会显示指定目录里的文件及文件夹清单。通过ls 命令不仅可以查看linux文件夹...
Perl读取文件中的科学计数法数字是是以字符串读取的,需要将其转化为小数,方法如下 use Math::BigFloat;my $i = new Math::BigFloat '1.931533e-01'; 这里用到了Math::BigFloat这个包,就...
在进行数据集处理时,经常会合并两个数据集,这里说一下合并数据集常用的2个函数: 合并列:cbind 合并行:rbind 1.cbind cbind使用非常直观简单。当我们需要直接合并2个矩阵或数据框,不需...
采用TCGAbiolinks 去下载TCGA临床数据,并对数据进行整合
基因大数据挖掘的时代已经到来,您准备好了吗?
在作GSEA的分析时候需要提供一个预先定义好的基因集,用来评估基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用,那么基因集都包括哪些呢? GSEA官网的基因集...
利用aggregate对数据进行分组处理,包括分组求和,分组取均值,最大值,中位数等等
R语言中常见的基本字符串处理,涉及匹配、替换、分割、截取、大小写转换等等
命令行特殊字符处理方法