找到约 15 条结果

问题 请教老师,用自己的hmm文件,进行了domain的二次搜索,结果如下图所示。结果显示仍然会有很多只是匹配了一部分序列片段。我用这些部分比对上的结果截取序列后,再三大数据库对比发现也存在我想要的domain. 现在的问题是,如果要这些部分的结果截取序列,做进化树就会差异太大。如果不要部分比对上的,又怕少了家族序列。这样的情况如何处理,有没有相关的标准?谢谢

文章 基因组重测序docker镜像更新到2.0

...eseq:/work omicsclass/reseq:v2.0 如果需要用到最新的软件分析数据可以使用这个2.0版本的镜像,老用户重新下载示例数据压缩包   课程链接:https://bdtcd.xet.tech/s/1VQOjQ 

问题 有log2FoldChange的值怎么画热图

这个是Leaf-vs-Fruit的数据,这个log2FoldChange是不是Leaf-vs-Fruit的值?有这个值能不能画这个植物某个部位比如说叶的热图,那这个log2FoldChange和FPKM又有什么关系,还是说画某个部位比如说叶的热图要用FPKM,那FPKM这个数据又怎样得来...

问题 perl双层哈希赋值

...ator/KAKS.txt" or die "$!";        #这个文件是blast输出并经过筛选的结果。 my @read=<IN>;foreach (@read){ $count++; if(/^[^#]/){  my @a = split /\t/,$read[$count];   $ID{$count}{$a[0]}=1;   $ID{$count}{$a[1]}=1; }}close (IN);#print Dumper(\%ID);for my $con(keys %...

问题 有关于GSEA富集分析参数设置

...GSSize两个参数,这两个参数的理解是放入函数里面的基因数据在某条通路上的基因数据买该范围内才回入选做富集分析统计,还是本身某条通路在现在已经记录的库里面的基因数在设置的范围内才会入选进行富集分析?这两个参...

问题 LD衰减分析

您好,课程的数据demo关于GWAS中的LD衰减分析中的脚本是PopLDdecay -InVCF  ../00.filter/all.varFilter.vcf.gz \         -SubPop  popid.txt -MaxDist 500 -OutStat ld.stat。然而在群体遗传进化LD衰减分析中的脚本是 PopLDdecay -InVCF  $workdir/00.filter/clean.vcf....

问题 老师,您好,我们是做忙果基因家族分析的,用的是linux(用拟南芥的数据我们都能做出结果),但忙果注释文件gff总是报错,对我们学农的来说,对脚本真是一窍不通啊,根本不知道该怎么修改,老师叫我们把gff文件改成拟南芥的格式,用linux做,我们的基因id,mRNAid,蛋白id都是不一样的,我们想都改成与基因id一致的,我该怎么改啊,老师可以帮忙看看文件吗

文章 相关系数小结

...章简单快速,学习链接:基因家族分析实操课程2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读3. 转录组数据深入挖掘技能-WGCNA,提...

文章 下载TCGA基因表达量文件,应该选Count,FPKM还是FPKM-UQ ?

...到Gene A上的reads数量:1000     3. 比对所有基因上的reads数据量:1,000,000     4. 样品1中覆盖75%基因的reads数:2000  那么,FPKM和FPKM-UQ的计算结果如下:     FPKM  = (1,000)*(10^9)/[(3,000)*(1,000,000)] = 333.33     FPKM-UQ  = (1,000)*(10^9)/[(...

问题 情况是这样,去年我测了一个转录组,当时我做的物种还没测全基因组,也就是当时是无参的情况,今年最近该物种的全基因组数据发布了,我在全基因组中做了一个基因家族的分析,然后想在去年测得转录组中找到全基因组中相对应的基因,然后看其表达量,能否通过简单blast实现?或者有其他更为准确地方法吗?请各位老师赐教。

问题 affy包的函数处理dataframe时,要求dataframe是什么样的呢?

...‘probeNames’ for signature ‘"data.frame"’ data是一个生成的数据框,有行号和列号,数据都是numeric格式的。

问题 core_pan_gene_curve.r 运行时报错

动植物泛基因组分析:03.gene_family_pav分析自己的数据时,运行命令Rscript $scriptsdir/core_pan_gene_curve.r -i Orthogroups_PAV.tsv   --prefix core_pan_curve 出现以下报错信息 运行终止后,生成的结果文件如下 尝试从demo数据中cp Orthogroups_PAV.t...

问题 老师,热图和进化树结合绘制用到的表达量文件在notpad++里如何把空格批量变成逗号

因为一直报错,我想是表达量表的格式没有和给出的参数格式不一致,除开第一列与后面的数据用tab键分开,其他的数据如何批量增加逗号

文章 非小细胞肺癌(GSE148071)

数据下载: wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE148071&format=file" -O GSE148071_RAW.tartar xvf GSE148071_RAW.tar 数据map.txt 准备: GSM4453576 P1 71 female LUSC advanced GSM4453577 P2 62 male LUAD advanced GSM4453578 P3 67 male LUSC advanced GSM4453579...

文章 混池(BSA)定位必看的10个知识点!

...没有亲本的情况下进行,但这样定位效果肯定不如有双亲数据的实验。建议重新杂交构建群体,保存好亲本DNA,以备后用。 Q4:子代取多少样品才够呢? A4:子代的取样应当符合以下原则:定位质量性状的,应该取尽可能多的...