找到约 15 条结果

文章 获取关系矩阵(WGCNA)

...929  468.8953  66.7984 108.79391 8.12127 1,计算矩阵内,每对象(需计算的对象)--基因(或者其他)两两之间的相关性:相当于列两两之间计算 cor:pearson,构成一12X12的对称2关系矩阵,行列皆为ABC.....,譬如A行,反应了基...

文章 三代转录组,当前你不可忽视的研究手段

...、 MXMT1和 DXMT2 的序列 与其祖先种中果咖啡中转录组本有更好的一致性,这表明这些基因转录可能来自于中果祖先种所提供的那部分遗传物质;相反XMT2 、 MXMT2 和DXMT1 所表现出的一致性要差一些,所以这几基因的转录组可能来...

文章 这种机器学习算法已经在微生物分析中成功应用

...其适用。 简单的说,随机森林就是用随机的方式建立一森林,森林里面有很多的决策树,并且每棵树之间是没有关联的。得到一森林后,当有一新的样本输入,森林中的每一棵决策树会分别进行一下判断,进行类别归类...

问题 awk命令提取两txt中第一列内容相同的行

有两文件,想让第一文件的第一列,如果与第二文件相同的话,则输出第一文件的整行,例如 第一 1.txta b 1b d 2c r 6d w 3e t 9第二文件2.txtac输出的结果a b 1c r 6 类似于从gff文件中提取目标基因的注释

文章 IF=4.9 | 多倍体割手密IAA基因家族分析鉴定

...面至关重要。割手密(Saccharum spontaneum) 基因组中鉴定出92IAA家族成员,分布在32条(4n)染色体上,并基于系统发育和motif分为三组,进行基因家族扩张分析。通过顺式作用元件预测了参与植物激素调节和应激反应的启动子,...

文章 HKT 基因家族分析-家族成员只有位数10以内该如何发文

...迫应答相关;HKT基因家族,是一类非常小的家族,通常一物种中HTK家族成员为位数,非常的少,如果只分析一物种中HKT家族基因的话,很多图标由于基因数量太少无法绘制,或者绘制之后很难看,这时候,我们可以在多...

文章 如何计算基因组中的连锁不平衡

...实际关联不强,D'也可能接近1。而r²对样本量敏感,但能更好地反映位点间的预测能力,比如在关联分析中,r²高说明一位点能较好地代表另一位点。在实际的数据分析中,D'可能更适合用于确定历史重组事件,因为它能反...

问题 根据覆盖度及比对率如何剔除样品、gatk VariantFiltration过滤

老师您好,我的基因组是1.37G的,目前我的298重测序样本的数据平均覆盖度是7.76,平均比对率是96.21%,目前还有一些样本是平均覆盖度(18样本低于5X)和比对率(13低于85%、其中1为68%)较低(见下图),想请教老师平均覆...

文章 MISA(在线)注释叶绿体基因组SSR

...串联重复。 简单重复顾名思义就是以很短的序列为一单元,比如5碱基(ACGTA),连续进行重复多次的重复。根据重复单元的长短,可将其细分为如下几类。 < 6 bp 微卫星DNA10-60 bp 小卫星DNA100-300 bp 卫星DNA 等。。。今天介...

文章 桑基图绘制

...(iris,       aes(axis1 = Species, axis2 = Class,axis3=price)) +#指定2轴  geom_alluvium(aes(fill = Species), width = 1/20) +  geom_stratum(width = 1/10, fill = "black", color = "grey") +#规定纵向绘图格式  geom_label(stat = "stratum", aes(label = after_stat(stratum))) +#添加标...

文章 微生物多样性分类柱状图按照分组进行排序脚本升级;tax_bar_plot.r

...}else{odf=df[order(df[,2],decreasing=T),]}#合并计算Other,最多绘制15物种的分类柱状图if(nrow(df)&gt;15){xdf=odf[1:15,]print(class(odf[16:nrow(odf),2:ncol(odf)]))other=data.frame(c("Other",colSums(data.frame(sapply(odf[16:nrow(odf),2:ncol(odf)],as.double),check.names=F))),check.names...

文章 非小细胞肺癌 (GSE139555)

数据下载与整理: wget -c https://ftp.ncbi.nlm.nih.gov/geo/series/GSE139nnn/GSE139555/suppl/GSE139555%5Fall%5Fmetadata.txt.gzwget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE139555&amp;format=file" -O GSE139555_RAW.tartar xvf GSE139555_RAW.tarcat map.txt|while read g s p;do  m...

文章 fasta格式文件介绍 What is FASTA format?

What is FASTA format? FASTA format is a text-based format for representing either nucleotide sequences or peptide sequences, in which base pairs or amino acids are represented using single-letter codes. A sequence in FASTA format begins with a single-line description, followed by lines of sequence ...

文章 多款软件进行vcf合并--gatk、vcftools、bcftools

...本的变异数据。这种文件很难对同组不同样本进行差异SNP分析,此处就需要对文件进行合并。vcf文件的合并有很多的软件可以做,主要的就是GATK、vcftools和bcftools三种,但是具体的合并方法需要根据不同vcf文件中的信息来判断。 ...

文章 亚型划分比较波浪图(桑基图)绘制

...她的身影。 比如在一篇2021年发表于The Journal for ImmunoTherapy of Cancer上的影响因子为13.75的文献《m6A modification patterns and tumor immune landscape in clear cell renal carcinoma》中,作者利用桑基图来描绘m6A簇、免疫亚型和m6A score的变化(B图)...