生存曲线图的绘制
今天跟大家分享一个分析蛋白保守结构域的的网站: 网址:http://www.ebi.ac.uk/interpro/ 在上图的方框导入蛋白序列,点击submit,就开始运行,结果如下图所示: 这个网站不仅分析了蛋白的保...
TCGA数据进行多因素的生成分析
TCGA 表达数据进行单因素生存分析
在R中利用split,借助数据的分类类型,对数据进行分组
R语言中常见的基本字符串处理,涉及匹配、替换、分割、截取、大小写转换等等
利用R 对文件夹下的文件批量读取
命令行筛选差异基因
GSEA的定义 Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用。其输入数据包含两部分...
python
初探ggplot2
linux常用命令整理之文件解压缩:tar命令:解压:tar xvf FileName.tar压缩:tar cvf FileName.tar DirName gz命令解压:gunzip FileName.gz压缩:gzip FileName zip命令解压:unzip File...
现如今,基于高通量测序得到的SNP信息无疑是海量的,然而SNP标记的验证却并不容易实现。其最好的验证方式是一代sanger测序,不过价格较高,而且通量低。如果SNP刚好位于酶切位点上,就可以将其转化为CAPS标记,利用跑胶的方式对其进行验证,既便宜又好用。
利用ggplot2绘制箱线图,并进行分面处理。
解决Bioconductor安装软件比较慢的问题
查看read.table参数
如何快速知道你的多个序列的长度呢?这里还是分享一个虚拟机的bio-linux的工具,samtools。命令行格式:samtools faidx xulie.fa(你的序列文件)结果会生成一个 xulie.fa.fai文件,也是就是在...
Perl提取指定位置的基因序列用到 substr 函数,用法: $gene = substr( $fasta,$start-1, $end - $start+1); 其中$fasta是总的序列;$start是提取序列的开始位置,由于Perl字符串是从0计数的...
金币能干什么
biolinux