找到约 15 条结果

文章 为什么大公司一定要使用 DevOps?

...。   事实上,并不是这两团队之间的协作帮助交付了更好的软件,而是“开发”和“运维”团队之间的统一导致了软件的改进,并以更快的速度交付。我们不要忘记DevOps工具在实现自动化方面所扮演的角色。   开发和运维...

问题 ALLHIC显示找不到sample.bwa_mem.bam

....ALLHiC2/sample.bwa_mem.bam'。但该地址下是有该文件的。 第二问题是ALLHIC1时形成了sample.clean.counts_GATC.13g1.txt、sample.clean.counts_GATC.13g2.txt、sample.clean.counts_GATC.13g3.txt,然后就中断,没有继续形成,染色体数目是设置了13. 第三报...

问题 有参转录组自主分析学习过程中遇见的问题

...的是水稻的转录组。在整分析的过程中,我是从Ensembl Plants数据中下载的基因组文件(Oryza_sativa.IRGSP-1.0.dna.toplevel.fa)和基因组注释文件(Oryza_sativa.IRGSP-1.0.46.gff3),然后利用命令:gffread Oryza_sativa.IRGSP-1.0.46.gff3 -T -o Oryza_sativa.g...

文章 利用sed 命令去掉windows下回车符

在Windows中文件的换行符与linux中是不同的,其在linux中显示为^M,在使用脚本处理时并不希望有这符号,所以需要去掉此符号,其方法如下: sed  -i 's/^M//g'  test.txt    ^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m

文章 使用hisat2软件将测序数据比对到基因组

...isat2-build  genome.fa  genome.fa#双端read比对hisat2 --new-summary -p 10 -x genome.fa -1 1.fastq.gz -2  2.fastq.gz  -S  rnaseq.sam#单端read比对hisat2 --new-summary -p 10  -x genome.fa -U rnaseq.fastq.gz  -S  rnaseq.sam#排序并生成bam文件samtools sort -o rnaseq.bam rnaseq.s...

文章 如何快速从转录组数据中筛选目标基因!

...量测序数据中筛选出目标数据?这是困扰大多数老师的一难题! 以转录组为例,想要挖掘数据,首先要看得懂数据,这是基础。 接下来小编以一excel的简单函数为例,演示一下如何从表格中快速筛选感兴趣的基因等信息。...

问题 请问关于转录本拼接整合的问题

使用stringtie merge -G参考注释,得到合并的gtf文件后,用这gtf去算fpkm,结果里有的trans id 是MSTRG。有人说是参考注释有问题,我是在ensembl plant上下载的gtf文件,好像没什么问题。 还有请问lncRNA分析,注释文件的gene id和trans id是...

文章 linux中sed在文件部分列尾添加字符

在文件中包含>字符的行尾添加-mRNA。 sed -i '/>/ s/$/-mRNA/' pep.fa 将文件中mRMA和;之间的字符删除。 sed 's/mRNA\(.*;\)/mRNA;/g' gene.gff >gene_new.gff

问题 cc1plus: error: unrecognized command line option "-std=gnu++11"

安装R包报错: * installing *source* package ‘later’ ... ** package ‘later’ successfully unpacked and MD5 sums checked ** using staged installation Running configure script -latomic linker flag not needed. ** libs g++ -std=gnu++11 -I"/share/work/biosoft/R/R-v3.6.1/lib64/R/include...

文章 GEO数据库的搜索下载数据技巧

1、首先GEO数据库是什么鬼呢? GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前...

文章 统计每窗口内SNP变异位点数量

bedtools 软件可以统计每窗口内SNP变异位点数量,具体命令如下: bedtools coverage -a window.bed -b raw.filtered.snp.vcf.gz  -counts >result.txt 其中bed文件格式如下: 结果文件如下: 最后一列为每窗口内SNP数量。

问题 gatk4 HaplotypeCaller报错

老师您好!在做变异组的时候有如下问题 命令:gatk --java-options -Xmx2g  HaplotypeCaller -R genome.fasta -I test.bam -O test.g.vcf.gz -ERC GVCF 报错:A USER ERROR has occurred: Bad input: We encountered a non-standard non-IUPAC base in the provided input sequence: '13' 请...

问题 GCVF合并

...,在导入db这一步中,除了染色体,参考基因组还有contig7,contig53,contig164,这种怎么处理呢,-L 参数后面还需要跟contig吗?chr.list表格里还需要加上contig吗? gatk  --java-options "-Xmx400g" GenomicsDBImport  \   -L chr.list --tmp-dir $tmpdir  ...

文章 进化树+基因表达热图二合一靓图绘制教程

...化关系,不仅直观地展现了物种的进化发育系统,还把每基因的表达量信息也展现出来,是不是很漂亮!今天我就教大家绘制上面这图,让你的图成为进化树中最靓的仔! 1. 数据准备 (1) 拟南芥基因的氨基酸序列 (2...

问题 相关系数矩阵

计算OTU间两两相关系数矩阵 ,数据量大时,可应用WGCNA中corAndPvalue, 但p值需要借助其他函数(the Benjamini and Hochberg false discovery rate (FDR))矫正。具体如何实现呢,望大神赐教!!