找到约 15 条结果

问题 老师,你好。在做有参转录组分析,准备的文件有基因组注释文件gtf,cds,pep(其中cds,pep都是fasta格式的序列文件),命令如下。其中第一个截图是参考pep文件,比对率为0,;第二个结果是参考cds文件,比对率为57.81%,比较低,这是哪里出了问题吗。另外所以准备的文件应该是cds文件而不是pep文件是吗

# 对基因组构建HISAT indexecho "Step1: build reference index "hisat2_extract_splice_sites.py /bioData/run_data/lixp/work/GZ_yangtao2/refs/Yangtao2.coding.gene.V1.0.20190227.gtf > /bioData/run_data/lixp/work/GZ_yangtao2/refs/splicesites.tsvhisat2_extract_exons.py /bioData/run_data/lixp/work/G...

问题 Linux中FOR循环做BWA比对报错[main_samview] fail to read the header from "-".

按照重测序课程中的命令 for i in CB2 CB3; do echo  "RUN CMD: bwa mem  Prunus_dulcis.T2T.assembly.fa ${i}_1.fq.gz \ ${i}_2.fq.gz -t 10 -M \ -R '@RG\tID:${i}\tLB:${i}\tPL:ILLUMINA\tSM:${i}' \ |samtools view -bS -h - > ${i}.bam" nohup bwa mem  Prunus_dulcis.T2T.assembly.fa ${i}_...

文章 TCGA数据下载—TCGAbiolinks包参数详解

..., "BCR Auxiliary XML", "BCR OMF XML", "BCR Biotab", "MAF", "BCR PPS XML", "XLSX"),通常情况下不用设置,默认就行; 11 experimental.strategy 用于过滤不同的实验方法得到的数据: Harmonized: WXS, RNA-Seq, miRNA-Seq, Genotyping Array. Legacy: WXS, RNA-Seq, miRNA-Seq...

文章 从GTF中提取lncRNA的编号和名称

... (<$fh1>) { chomp; my @array = split /\t/, $_; if($array[2]eq $biotype){ $biotype_list{$array[0]} = 1; } } close $fh1; open my $out, ">${biotype}_info.txt" or die; print $out "Gene_id\tGene_id_info\tgene_name\tbiotype\n"; open my $fh2, $gtf or die; while (<$fh2&...

文章 组装"预实验" | 物种倍性分析

...A* | awk '{ print "gzip -dc " $0}' > A_generate.filekmc -k21 -t16 -m64 -ci1 -cs10000 A_generate.file kmcdb tmp #计算k-mer频率# -k21:k-mer长度设置为21# -t 指定线程数# -m64:内存64G,设置使用RAM的大致数量,范围1-1024。# -ci1 -cs10000:统计k-mer coverages覆盖度...

文章 vcf文件annovar的注释结果绘制瀑布图maftools分析

...ldver hg38 -out  154 -remove -protocol \ refGene,cosmic70,nci60,esp6500siv2_all,clinvar_20210501,1000g2015aug_all,1000g2015aug_eas,1000g2015aug_sas,avsnp150,gwasCatalog,ljb26_all,cytoBand,dgvMerged,phastConsElements100way,genomicSuperDups -operation g,f,f,f,f,f,f,f,f,f,f,r,r,r,r -nastring . -vcfinp...

文章 rMATS turbo使用

...he BAM files for sample_1. (Only if using BAM) --b2 B2 A text file containing a comma separated list of the BAM files for sample_2. (Only if using BAM) --s1 S1 A text file containing a comma separated list of the ...

文章 不同物种基因组之间的比对与可视化

...本中获取,或者从公共数据库中下载已知的基因组序列。2.比对算法选择: 选择适合的比对算法进行基因组比对。常用的比对算法包括Smith-Waterman算法、Needleman-Wunsch算法、BLAST(Basic Local Alignment Search Tool)等。对于大规模基因组...

文章 如何做好项目管理,避免“计划”和“执行”两张皮?

...不要为了计划而计划。项目计划的制定主要用于指导项目工作开展,不是为了应付别人,必须基于实际的项目情况,以及为了有效完成项目而制定。其次,项目计划中清晰界定各项工作任务。项目计划在进行工作分解时,需尽可...

问题 成功安装WGCNA包后,调用时报错

...ger::install("WGCNA") Bioconductor version 3.8 (BiocManager 1.30.4), R 3.5.2 (2018-12-20) Installing package(s) 'WGCNA' also installing the dependency ‘GO.db’trying URL 'https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/contrib/3.5/WGCNA_1.66.zip' Content type 'application/zip' length 343655...

问题 遗传图谱构建

for chr in  {1..12};do  echo "snpbinner visualize --out bin.visualize.$chr --crosspoints pop.crosspoints.$chr  --snps pop.forbin.$chr --bins  pop.bin.$chr" done >view.sh ParaFly -c view.sh -CPU 5 该步一直运行不出结果,demo中01.PrepareData的bin.visualize.1-12文件夹为...

文章 R语言输出pdf图片,如果有中文出现乱码解决办法

...有一种字体可选。例子: pdf("chinese.pdf",family="GB1")plot(m2,xlab="高度",ylab="体重",main="统计")dev.off() 这里字体参数family只能设置成"GB1"(不知是否还有其他字体可选),默认宋体。 2、使用Cairo包,使用CairoPDF()函数输出 在使用C...

文章 Linux中用户组的管理:添加、修改 删除

...需要为新建用户指定一用户组,如果不指定其用户所属的工作组,自动会生成一个与用户名同名的工作组。创建用户user1的时候指定其所属工作组users,例:useradd –g users user1 1、使用命令 useradd 创建用户 例:useradd user1——创...

问题 提取基因上游1500bp的脚本是如何工作的?

文章 gff文件格式不标准的修改脚本

...加gene行,把mRNA的ID作为基因ID,同时去掉ID属性中的.1或.2或.3等这种.加数字的组合; 2.在mRNA行添加Parent信息,Parent信息为gene的ID信息,并把最后一列的source_id=Btabaci_GLEAN_10027186;类似的属性删掉,即mRNA行最后一列只有ID信息和Pare...