找到对应的样品,对应的基因看看GEO里面的基因表达量是否有相关就可以了,关键你得找GEO数据和会分析GEO数据。 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、 GEO芯片数据不同平台标准化 、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
回答于 2020-02-26 09:27
这个是用circos绘制的不同物种之间相同家族的共线性图,如果你想绘制这个需要学习一下circos软件; 我们基因家族课程里面有比较基因组分析,展示形式: 参考:https://www.omicsclass.com/article/284 基因组内家族成员关系我们课程里面也用到了circos,展示效果如下:
回答于 2020-02-26 09:23
这是由于 这个SNP附近有indel缺失造成的,大家可以参考GATK官方解释:https://gatk.broadinstitute.org/hc/en-us/articles/360035531912?id=11029 以及vcf文件说明:http://samtools.github.io/hts-specs/VCFv4.3.pdf
回答于 2020-02-25 11:08
由于SNP位点数量巨大,对应VCF文件也非常的大,为节省存储空间,最常见的做法就是压缩。bgzip 可以压缩VCF文件,用法如下bgzip raw.vcf压缩之后,原本的raw.vcf文件就变成了raw.vcf.gz文件。压缩后缀为.gz, 如果想要解压缩,有以下两种用法bgzip -d raw.vcf.gz gunzip raw.vcf.gzbgzip的压缩算法和gzip压缩算法有着相似之...
回答于 2020-02-24 16:54
lncRNA功能主要通过cis或trans(进行trans作用分析需要至少5个样品)方式作用于蛋白编码靶基因来实现; Cis作用靶基因预测基本原理认为lncRNA的功能与其坐标临近的蛋白编码基因相关,于是将lncRNA临近位置的(上下游100k)蛋白编码基因筛选出来作为其靶基因。trans作用靶基因预测基本原理认为lncRNA的功能不依赖于和编码基...
回答于 2020-02-24 11:08
用以下配置文件会更好: chromosomes_units=1000000 #刻度单位Mbkaryotype=./chr.info #染色体信息配置文件show_tick_labels=yesshow_ticks=yesspacing=10u<ticks> #设置染色体刻度 color=black format=%d multiplier=1e-6 radius=1r thickness=2p <tick> size=10p sp...
回答于 2020-02-24 10:04
这些参数和最终的绘图有关,可以稍加调整重新绘图,看看图片有啥变化,第一行是表头; 详情可看这里:https://www.omicsclass.com/article/284
回答于 2020-02-23 19:17
这个python版本的mcscan 显示染色体的时候只会显示染色体上的数字, 建议那些太短的scaffold就不要显示了,也没有共线性关系。
回答于 2020-02-23 19:12