找到约 15 条结果

文章 qiime2 分类器建立 SILVA数据

利用工具建立数据库  rescript qiime rescript get-silva-data \ --p-version '138' \     --p-target 'SSURef_NR99' \     --p-include-species-labels \     --o-silva-sequences silva-138-ssu-nr99-seqs.qza \     --o-silva-taxonomy silva-138-ssu-nr99-tax.qza 这个代码...

问题 重测序

我现在在做重测序数据比对和call SNP 分析,有个问题我想咨询一下:每个测序序列生成的g.vcf.gz的文件比较大,所用能一下子生成所有的g.vcf.gz文件,所以只能先生成一部分g.vcf.gz文件进行合并成vcf.gz文件,然后在生成另外一部分...

文章 windows 中的docker如何设置容器的内存与计算资源 hyper-V

...ttps://www.omicsclass.com/question/4584 建议: 对于高通量测序数据数据量都比较庞大,一般的笔记本电脑都不能胜任(内存限制),只能做练习使用。如果要分析数据尽量选择内存多的台式机或者服务器。 组学大讲堂云服务器即...

文章 非小细胞肺癌(GSE123904)

数据下载: wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE123904&format=file" -O GSE123904_RAW.tartar xvf GSE123904_RAW.tar 准备map.txt文件: LX653PRIMARY_TUMOURLX676PRIMARY_TUMOURLX682PRIMARY_TUMOURLX699METASTASISLX661PRIMARY_TUMOURLX255BMETASTASISLX682NORMALLX7...

文章 Treemix 软件:群体基因交流分析的得力工具

...原理可以分为三个要点: 1.计算协方差:使用基因频率数据计算每对群体之间的实际协方差。 2.构建最大似然树:利用基因型频率数据构建最大似然树,并计算协方差的估计值。 3.判断基因流:通过比较实际值与估计值之间的...

问题 共线性分析 视频介绍的不详细

这两个应该是同一类型问题,biosoft/miniconda/miniconda2/bin/python和/biosoft/MCScanX/MCScanX/MCScanX mcscan/AT这个路径进不去,是有权限吗还是怎么样,还有wget所获得的数据时这两个是什么数据别的物种家族该从哪获得?

文章 dQTL.seq方法研究基因定位

...己设置时cpu数目最大也为10,如果超过10,默认为10。 2. 数据文件准备 01. 通过数据分析获得混池的snp位点信息all_sample_snp.vcf。 对all_sample_snp.vcf中的snp位点进行过滤,过滤掉亲本杂合以及亲本相同的位点。 02. 格式转换 /share/...

文章 R语言基础入门—数组

...(array)是向量和矩阵的推广,是多维(三维或三维以上)数据。与向量和矩阵一样,数组的元素必须也是同一类型的数据。例如 - 如果我们创建一个维度(2,3,4)的数组,则会创建4个矩形矩阵,每个矩阵具有2行和3列。 创建数组 ...

问题 sam 转换成bam 格式并排序时,没转换成功。reads 与基因组进行比对map这里出错。

老师,我利用demo数据进行转录组分析。 在尝试将demo的数据,将sam 转换成bam 格式并排序时并没有转换成功。不太清楚哪里出了问题。 我不知道demo数据是否是链特异性文库,所以也就没去设置(RF or FR)。也不会设置。 所以...

文章 R语言基础入门—数据结构(1)

...为生信分析最常用的编程语言之一,经常被用于进行生物数据统计分析和绘图。之前小编给大家介绍了R语言下载安装和一些基础概念,今天继续介绍R语言的数据结构。 R语言数据结构包括向量,矩阵和数据框,数组, 列表,因...

文章 绘制生存曲线图

...可以绘制一个单因素的生存曲线图。 # 表达信息和生存数据整合到 exprSet, 其格式如下: bcr_patient_barcode time status LINC01587 XXbac_B461K10.4 1 TCGA-2W-A8YY 148 0 3.981761 23.89057 2 TCGA-4J-AA1J 226 0 37.491171 19.63823 3 ...

问题 无参转录组里的回比率问题

我做了个无参考基因组昆虫的转录组,公司先对所有样品的数据进行了拼接,形成一个unigene库,然后再把每个样品的数据回比到unigene库上,得到一个回比率,我这里是55%,感觉有点低啊,什么原因造成的呢?

问题 vcf合并

...的课程。我在分析的时候遇到了vcf文件合并的困难。我的数据是两部分组成的,一部分是自己测的,现在做到gvcf了,还有一部分是从已发表的文章中的vcf文件里提取出来一部分,参考基因组是相同。我的困难是怎么把这两部分...

文章 EggNOG基因序列批量注释

...s Groups)是基于直系同源蛋白进行分组比对的一个公共资源数据库,由EMBL维护,提供了不同分类水平蛋白的直系同源分组(Orthologous Groups ,OG),包括真核物种、原核物种及病毒的数据信息。数据库对每个同源基因类进行了系统...

文章 基因组组装质量评估

...的覆盖程度。一般需要借助RNA方面的证据进行评估,如EST数据或RNA reads。由于用来评估的RNA方面证据不同,得到的比例也会有差别。一般来说,50%的scaffold覆盖基因的95%以上,85%的scaffold覆盖基因的90%以上,认为组装较完整。 3. ...