找到约 15 条结果

文章 桑基图绘制

...(iris,       aes(axis1 = Species, axis2 = Class,axis3=price)) +#指定2轴  geom_alluvium(aes(fill = Species), width = 1/20) +  geom_stratum(width = 1/10, fill = "black", color = "grey") +#规定纵向绘图格式  geom_label(stat = "stratum", aes(label = after_stat(stratum))) +#添加标...

文章 微生物多样性分类柱状图按照分组进行排序脚本升级;tax_bar_plot.r

...}else{odf=df[order(df[,2],decreasing=T),]}#合并计算Other,最多绘制15物种的分类柱状图if(nrow(df)>15){xdf=odf[1:15,]print(class(odf[16:nrow(odf),2:ncol(odf)]))other=data.frame(c("Other",colSums(data.frame(sapply(odf[16:nrow(odf),2:ncol(odf)],as.double),check.names=F))),check.names...

文章 多款软件进行vcf合并--gatk、vcftools、bcftools

...本的变异数据。这种文件很难对同组不同样本进行差异SNP分析,此处就需要对文件进行合并。vcf文件的合并有很多的软件可以做,主要的就是GATK、vcftools和bcftools三种,但是具体的合并方法需要根据不同vcf文件中的信息来判断。 ...

文章 fasta格式文件介绍 What is FASTA format?

What is FASTA format? FASTA format is a text-based format for representing either nucleotide sequences or peptide sequences, in which base pairs or amino acids are represented using single-letter codes. A sequence in FASTA format begins with a single-line description, followed by lines of sequence ...

文章 亚型划分比较波浪图(桑基图)绘制

...她的身影。 比如在一篇2021年发表于The Journal for ImmunoTherapy of Cancer上的影响因子为13.75的文献《m6A modification patterns and tumor immune landscape in clear cell renal carcinoma》中,作者利用桑基图来描绘m6A簇、免疫亚型和m6A score的变化(B图)...

文章 44家机构联合破解巨型鱿鱼基因组!

...组,研究成果于今年年初发表在《Giga Science》上,算是一好的开端。文章里有不少篇幅描述了基因组的组装、注释等常规内容,在此就不赘述了,有兴趣的同学可以根据文末的参考文献自行下载研究。小编重点和大家聊聊文章...

文章 非小细胞肺癌 (GSE139555)

数据下载与整理: wget -c https://ftp.ncbi.nlm.nih.gov/geo/series/GSE139nnn/GSE139555/suppl/GSE139555%5Fall%5Fmetadata.txt.gzwget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE139555&format=file" -O GSE139555_RAW.tartar xvf GSE139555_RAW.tarcat map.txt|while read g s p;do  m...

问题 重测序

我现在在做重测序数据比对和call SNP 分析,有问题我想咨询一下:每测序序列生成的g.vcf.gz的文件比较大,所用能一下子生成所有的g.vcf.gz文件,所以只能先生成一部分g.vcf.gz文件进行合并成vcf.gz文件,然后在生成另外一部分...

文章 BMC genomics|26玉米基因组中萜烯合酶的多重变异模式

今天给大家分享一篇基于26玉米泛基因数据进行的基因家族分析文章——“Multiple variation patterns of terpene synthases in 26 maize genomes”于今年发表在BMC genomics杂志上,影响因子为4.4,中科院分区为2区。 在玉米中,有一种重要的次...

文章 TCGA数据挖掘生物信息文章(肺鳞癌)

...者从TCGA下载所有肺癌的RNA-Seq数据(截至2017.4.5),共502肺鳞癌样本数据,其中原发性肺鳞癌样本数据450。提取这450样本的lncRNAs数据进行后续分析。 筛选显著变化的lncRNAs 筛选在不同样本中表达普遍有变化的lncRNAs 5664...

文章 删除向量中指定的元素(借助向量中元素索引)

...一次出现的索引下标,用which()获得全部"a"的索引下标。 > A=c("a","c","e","b","d","a","b","d","f","e","g")> match("a",A)[1] 1> match(c("a"),A)[1] 1> which(A=="a")[1] 1 6 而删除的操作仅需要进行在向量中写入负的索引下标即可,如删除所...

文章 开年第一篇!2区基因家族分析文章赏析!苦荞MAPK家族分析-2022年2月3日,最新文献!

...Motif,绘图如下: 5. 苦荞FtMAPKs顺式作用元件分析为了更好地了解FtMAPK的功能和对应激反应基因表达的精确调控,我们对FtMAPK启动子区域的顺式作用元件进行了鉴定和分析。 6. 苦荞FtMAPKs蛋白3D结构作者分析了16FtMAPKs蛋白的...

文章 VG 泛基因组call 变异

#this script report the commands used to call variants from the 16 Illumina WGS barn swallow individuals.#for steps 1-3, this github solution was followed: https://github.com/vgteam/vg/issues/3411#for steps 4-9, the section "Calling the graph by first splitting into components" of this tutorial was ...

文章 Shell字符串截取(非常详细)

...串)开始截取。 从指定位置开始截取 这种方式需要两参数:除了指定起始位置,还需要截取长度,才能最终确定要截取的字符串。既然需要指定起始位置,那么就涉及到计数方向的问题,到底是从字符串左边开始计数,还...

文章 R语言绘制多分组差异分析结果图

...FDR<0.001,"FDR<0.001","FDR&gt;=0.001") 5 ggplot2绘图 #获取每火山图中前十差异基因 TopGene <- data %&gt;% group_by(cluster) %&gt;% distinct(ID, .keep_all = T) %&gt;% top_n(10, abs(log2FC)) table(TopGene$cluster) #背景柱状图数据准备 dbar <- data %...