找到约 15 条结果

文章 Linux单行命令

...本文件做集合交、并、差运算时可以使用sort和uniq sort a b | uniq > c # c 是 a 并 b sort a b | uniq -d > c # c 是 a 交 b sort a b | uniq -u > c # c 是 a - b awk常用命令 awk '{ sum += $2 } END { print sum }' myfile        #这命令将计算myfile文...

问题 为什么脚本运行会失败,基因组大小2.1G,我给了10G虚拟机内存

问题 老师,我做的物种是棉花,基因组约3.5G 利用组学大讲堂的方法建立索引失败,应该是内存不够,一般的电脑都是这样的,即使使用的小型服务器内存也达不到100G,这问题应该怎么解决,这一步无法解决,后续无法分析,老师可否给一可行性的意见!

问题 这条命令报错cat ../id.txt|while read ind;do cut -d" " -f1 ./check/${ind}_pep_need_to_confirm.fa|sed -e "/^>/ s/$/_${ind}/g" -e "s/\*//g" > ./check/${ind}_pep_need_to_confirm.fas

问题 共线性分析

老师,我在做2基因组共线性分析时,得到的结果不对,但我找不到原因,您帮我看看,谢谢!

文章 linux中sed 替换

...令可以直接替换文件中的内容其用法如下: sed -i 's/A/a/g' file.txt 参数-i 会在源文件中直接替换,所以要确定后在使用此参数。 s表示替换,后通常跟正则表达式。 该命令会按行替换文件中所有的A,如果只想对文件中的某些行...

问题 关于使用nohup vcftools过滤vcf文件的问题

...e.raw.vcf.gz,并使用vcftools软件进行过滤,并试验了使用nohup和不使用nohup后得到的文件结果比较,使用nohup得到的vcf文件结果有异常不能进行后续分析,具体如下: 1)不使用nohup时的代码 vcftools --gzvcf rice.raw.vcf.gz --recode --recode-INF...

文章 python 读取kegg绘图配置文件中的kgml文件内容

keggkgml文件需要我们读取里面的内容,分享python代码如下: # -*- coding: utf-8 -*-  ''''''import sys, os, argparse, glob, os.path,timereload(sys)sys.setdefaultencoding('utf8')from pyh import *import numpy as npimport mathimport reimport xml.dom.minidom from xml.dom.minid...

文章 Perl 子程序(函数)

...Perl 子程序也就是用户定义的函数。 Perl 子程序即执行一特殊任务的一段分离的代码,它可以使减少重复代码且使程序易读。 Perl 子程序可以出现在程序的任何地方,语法格式如下: sub subroutine{ statements; } 调用子程序语...

文章 一键搞定批量序列提取TBtools!

...,ctrl+C、ctrl+V就好了,少量基因的还OK,但是如果有几百甚至上千ID,手指会不会很酸爽? 这里墙裂推荐一软件,功能很强大,就是TBtools!今天主要讲它批量提取序列的功能(其他功能以后再说,你们也可以自己试试),这...

问题 gff文件包含gene,cds,exon,mRNA的信息,但gene 和mRNA名称相同,不利于建立基因组索引,如何使用AWK命令批量只在mRNA的ID后面+.1?

例如:修改前 01EVMgene590510967.+.ID=GB_A01G0001; A01EVMmRNA590510967.+.ID=GB_A01G0001;Parent=GB_A01G0001; A01EVMCDS59056099.+0Parent=GB_A01G0001; 修改后: 01EVMgene590510967.+.ID=GB_A01G0001; A01EVMmRNA590510967.+.ID=GB_A01G0001.1;Parent=GB_A01G0001; A01EVMCDS59056099.+0Parent=GB...

问题 在运行table_annovar.pl脚本的时候报错

table_annovar.pl ./ -buildver all_sample_INS_DEL.vcf.gz -out all_sample_INS_DEL -remove -protocol refGene -operation g -nastring . -vcfinput ##报错如下,all_sample_INS_DEL.vcf.gz和unknow相关文件见附件 归档.zip NOTICE: the --polish argument is set ON automatically (use --nopolish ...

文章 人免疫细胞marker基因

...解各种免疫细胞的详细分类以及与之相关的Marker Gene 是一复杂且持续发展的领域。以下是一些常见的免疫细胞亚型及其相关的Marker Gene 示例。请注意,这列表只涵盖了一些基本的免疫细胞类型,而不是详尽的分类。细胞类型...

文章 R-常见的字符串处理方法

A =c("abcdgegh")B = c("abcdgegh","deghgabcd") 匹配 grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE, invert = FALSE)grepl(pattern, x, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)##ignore.case 决定匹配是否对...

文章 GSEA分析需要的基因集Molecular Signatures Database是什么?

在作GSEA的分析时候需要提供一预先定义好的基因集,用来评估基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用,那么基因集都包括哪些呢? GSEA官网的基因集Molecular Signatures Database,含...