找到约 15 条结果

文章 clinvar数据库人类疾病数据库ANNOVAR数据库使用

clinvar是一开放的数据库,每研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4不同的星级,星级越高,可信度越高。 数据库地址...

问题 基因家族分析中基因家族成员的筛选与取舍如何判断?

...hmm文件也就是对应基因家族的隐马尔科夫模型筛选得到一蛋白序列,另外我又采取blast的方式将我要研究的这物种和其他几物种的该基因家族序列信息进行比对,获得另一蛋白序列文件,现在想将二者进行合并去重复,...

问题 构建物种发育树,使用busco获取单拷贝基因出错

我想要构建一物种系统发育树。想使用busco分析获得单拷贝基因,进行后续分析。 大部分的物种busco分析完毕,2物种直接卡死在Augustus分析阶段,使用htop查询,也没有augustus进程在运行。想询问老师们,是否有遇到这样的问...

问题 《微生物宏基因组分析实操》课程,配制分析环境(doc.sh)遇到Bug

...可用。我用Rstudio和组学大讲堂提供的服务器分别下载这镜像(docker pull docker.io/omicsclass/metagenomics:v1.0),但是下载需要数小时然后也报错。 求教我应该如何解决?

文章 Perl 包和模块

Perl 包和模块 Perl 中每包有一单独的符号表,定义语法为: package mypack; 此语句定义一名为 mypack 的包,在此后定义的所有变量和子程序的名字都存贮在该包关联的符号表中,直到遇到另一 package 语句为止。 每符...

问题 GATK 很慢,怎样分染色体CALL 变异

在使用GATK CALL 变异的时候非常的慢,一天一样本还没有结束,能不能分染色体CALL 变异?原先的命令如下: gatk --java-options "-Xmx50g" HaplotypeCaller -R $REF   \     -I $workdir/3.map/result/${i}.sorted.dedup.bam \     -O ${i}.g.vcf.gz --max-alterna...

问题 老师就BSA分析中MutMap 分析:95% 99%阈值置信区间是如何计算的这我还有点疑惑

老师就是这阈值计算,您的R里面需要提供3参数,能否指导下这三参数分别是什么呢?或者有没有示例数据和代码呢?这我研究了好久都没搞懂 谢谢老师! https://www.omicsclass.com/article/1305就是这链接里面的R代码

问题 泛基因家族分析,系统发育树构建

...因有一千二,和拟南芥一起构树,拟南芥家族基因三十多,现在存在问题是:1.私有基因很多,一千多,需要都用来构树吗?2.构树后,该怎么给每簇命名,我是根据拟南芥基因聚类结果,即查看该簇内拟南芥基因的注释看...

问题 meme分析后显示error at: maxw

进行meme分析,输入命令:/biosoft/meme/meme-v4.12.0/bin/meme ../pep_id-seq-F.fa -protein -oc ./ -nostatus -time 18000 -maxsize 6000000 -mod anr -nmotifs 10 -minw 6 maxw 100 显示:error at: maxw及以下信息,反复查看找不到原因,老师能否解决以下。 Usage:meme<dat...

文章 seqkit根据序列ID筛选fasta文件

#根据序列ID特点筛选对应ID序列$ zcat hairpin.fa.gz | seqkit grep -r -p ^hsa &gt;hsa-let-7a-1 MI0000060 Homo sapiens let-7a-1 stem-loop UGGGAUGAGGUAGUAGGUUGUAUAGUUUUAGGGUCACACCCACCACUGGGAGAUAACUAU ACAAUCUACUGUCUUUCCUA &gt;hsa-let-7a-2 MI0000061 Homo sapiens let-7a-2 stem-loop AGGUUGAGGUAGU...

文章 metascape数据库

...的更新也已经两年半了。而Metascape每月更新其相关的40多数据库,以确保提供最准确的结果。因此Metascape数据库可以作为富集分析的比较好的手段。 metascape:https://metascape.org/gp/index.html#/main/step1 step1:粘贴基因列表或者是上...

文章 R安装units包报错解决方法

如下安装units包时,报错。 install.packages("units") 报错内容: * installing *source* package ‘units’ ...** package ‘units’ successfully unpacked and MD5 sums checked** using staged installationconfigure: units: 0.8-2checking whether the C++ compiler works... yeschecking for...

问题 hmmer网站搜索蛋白序列中的结构域,得到几domain,但是序列范围重叠。

...站搜索蛋白序列中的结构域,如下图,hits found是3即得到3Thioredoxin domain: thioredoxin、thioredoxin_2、thioredoxin_9,但是序列范围重叠,72-174、85-172、64-173,是什么情况?实际这蛋白序列中只有一thioredoxin domain吗? 用NCBI-CDD搜索的...

文章 siRNA

...是siRNA ? siRNA(small interfering RNA 小干扰RNA) 是由 20-25 核苷酸组成的双链 RNA 分子。一般3’端有两游离的碱基,通过RNA干扰途径沉默目标基因。 RNA干扰(RNAi) 在RNA干扰通路中,siRNA 通过与互补 mRNA 分子杂交干扰基因表...

文章 R语言-文件读写

... fileEncoding = "", encoding = "unknown", text, skipNul = FALSE) 每参数都有自己的意义,其中比较常用的有header,sep等. file是我们读入的文件名称;header,设置为T或F,是否把第一行定义为header;sep是设置文件内的分隔符。我们看例子...