dCAPS是由CAPS标记衍生的分子标记。它是通过引物引入错配的碱基,从而构建或者去除限制性内切酶识别位点的标记技术
清华大学电子工程学院学生 洪峰
降维排序分析方法包括:PCA、PCOA、CA、DCA、NMDS、RDA、CCA等等还有很多,理解他们的区别与联系才能熟练运用。
教你利用GEOquery并结合Biobase下载GEO数据库多种数据,轻松数据下载与整理。
利用“xlxs"读取真Excel文件中的内容
利用ggplot2绘制密度图,并直接在密度图上叠加另一组数据的密度曲线
利用R 对文件夹下的文件批量读取
WGCNA剔除异常样本
TCGAbiolinks 下载 TCGA 数据
awk擅长于对文件按行操作,每次读取一行,然后进行相应的操作。 awk读取单个文件时的基本语法格式是 awk 'BEGIN{OFS=FS="\t"}{print $0, $1;}' filename 读取多个文件时的语法是 awk...
WGCNA常见问题
命令行筛选差异基因
对于科学问题,我们常常要找到差异,需要用到统计学检验,但是那么多统计学检验我该如何选择呢?
用perl批量处理文件夹下所有文件 opendir()获取目录权柄;readdir()读取目录下文件 #!/usr/bin/perl -w $dirname = "/tmp"; #指定一个目录 opendir ( DIR, $dirname ) || die...
Mean()求平均值 通过求出数据集的和再除以求和数的总量得到平均值 函数mean()用于在R语言中计算平均值。语法 用于计算R中的平均值的基本语法是 - mean(x, trim = 0, na.rm = FALSE, ...)...
距离矩阵差别:jaccard bray-curtis 欧式距离 unifrac(weighted/unweigted)
之前在linux系统执行以下命令: ls file |xargs sed -i 's/\n//g' 然而却发现没有任何效果,百度之后发现 sed是按行处理文本数据的,每次处理一行数据后,都会在行尾自动添加trailing newline...
GSEA的定义 Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用。其输入数据包含两部分...
Ka/Ks表示的是非同义替换(Ka)和同义替换(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。 同义/非同义突变概念 同义突变表示氨基酸没有改变,氨基酸没...
组学大讲堂视频课程