找到约 15 条结果

文章 基因组Hic挂载AGP文件格式说明

...分别是:1. 大片段的序列名(object) 2. 大片段起始(object_begin) 3. 大片段结束(object_end) 4. 该段序列在大片段上的编号(part_number)     一般一个大片段由多个小片段和gap组成。此处则为这些小片段和gap在大片段上的编号。 5. 该段序列...

文章 BLINK(C版本) 进行 GWAS分析的教程

...箱中的最新的模型,具有统计效力高,速度快的特点。BLINK 作为FarmCPU 的 C 语言升级版,对关联位点具有更灵敏的探测能力,而且具备分析超大型数据集的能力,可以使用 CPU 和 GPU 进行异构运算。 GAPIT目前整合了多种算法...

文章 RDA CCA 分析

...。如果遇到p值相等的情况,拥有最小AIC信息准则(Akaike information criterion,AIC)的变量应该入选。最好的变量也就是最显著的变量。 (3)寻找模型中第二个、第三个、第四个……解释变量。上一步选取了只含有一个最好变量的...

文章 使用官方gdc-client软件下载TCGA数据

...ion:在页面右边勾选自己想要的数据,然后点击 view Files in Repository,跳转到Repository页面进一步筛选. 2)Repository:在页面选项卡选择自己需要的数据,然后点击Manifest下载: 2、gdc-client软件安装和配置 1)下载软件地址:ht...

文章 利用biopython将cds序列翻译成蛋白序列

...> messenger_rna.translate() Seq('MAIVMGR*KGAR*', HasStopCodon(IUPACProtein(), '*')) 2. cds序列翻译成蛋白序列 >>> from Bio.Seq import Seq >>> from Bio.Alphabet import IUPAC >>> coding_dna = Seq("ATGGCCATTGTAATGGGCCGCTGAAAGGGTGCCCGATAG", IUPAC.unambiguous_dna)...

问题 perl脚本去除fa文件中ID重复的序列

... $GZ2 , -format => 'fastq');my %id;while ( my $obj1=$fq1->next_seq() and my $obj2=$fq2->next_seq() ) {my ($id1,$id2)=($obj1->id,$obj2->id);if(exists $id{$id1}){next;}else{$id{$id1} = 1;}$out1->write_seq($obj1);$out2->write_seq($obj2);}}} ...

文章 基因家族分析文章思路解析

...了一篇毛竹bHLH基因家族分析文章(发表在《Plant Physiology and Biochemistry》(IF=2.718)上),这篇文章于2018年7月9日投稿,8月28日就返修并接收了,可见该类型文章仍然在不停的产出。 此类论文写作模式类似,且近年发表数量依...

文章 SNP分析中由于基因组序列过长导致报错解决方法

...列长度过长,会导致GATK软件报错。如下所以: Exception in thread "main" htsjdk.samtools.SAMException: Exception when processing alignment for BAM index A00253:355:H75GLDSX2:2:1334:20989:8625 1/2 150b aligned read.        at htsjdk.samtools.BAMFileWriter.writeAlignment(BAMFile...

文章 WGCNA、生存分析、ROC共同筛选biomarker

...疾病的诊断和治疗。 参考文献: Yang Q, Wang R, Wei B, et al. Candidate Biomarkers and Molecular Mechanism Investigation for Glioblastoma Multiforme Utilizing WGCNA[J]. BioMed research international, 2018. 相关课程: TCGA-基因差异表达分析、 TCGA-生存分析 、 G...

文章 简单实验+蛋白质组=4分文章, So Easy!

...状态。因此,小编就用一篇今年10月12号发表在“Frontiers in Microbiology”上的蛋白质组学文章为大家简单介绍一下研究思路。 01/研究材料 本文的研究对象是灰霉病菌,具体是采用茶树油(TTO)处理灰霉病菌,取未处理的作为对照...

文章 NCBI上传高通量测序数据到SRA数据库 aspera 支持续传

...文件数量有限;一旦链接断开就得重新来: 这里介绍用linux中aspera的命令行来执行上传数据,会更稳定: linux当中安装与使用: 1.安装,下载地址:https://downloads.asperasoft.com/en/downloads/62 得到文件如下: 64-bit Linux: aspera-cli-x....

文章 GWAS cFDR 多效基因分析

...unction(p1,p2,                            xlab=expression(nominal-log[10]~~(q[expected])),                            ylab=expression(empirical-log[10]~~(p[observed])),t="Stratified Q-Q Plot"){        library(ggplot2)        #p1 = p1[p1!=0]        #p2 = p2[p2!...

文章 蛋白信号肽预测—SignalP使用详解

...utoffvalues一般默认即可;结果图片格式可以选择第三个PNG and EPS(矢量格式);输出格式一般选择Standard 和Long;Method选项是区分蛋白序列中是否存在跨膜区域(TM regions),假如明确知道无跨膜区域,就选择不包括跨膜区域预测会...

文章 cutree对pheatmap返回结果实现聚类cluster划分

... by hclust. cutree() only expects a list with components merge,height, and labels, of appropriate content each.kan integer scalar or vector with the desired number of groupshnumeric scalar or vector with heights where the tree should be cut. 所以将热图结果中的list$tree_row作为tree...

文章 25天破解“粮食杀手”草地贪夜蛾基因组

...境内的草地贪夜蛾可能是从非洲入侵(注:这里原文说是invaded from Africa,但新华每日电讯的稿件说是从美国飞入)。这些族群信息、基因组特性、入侵预测都为害虫的防治提供了重要的帮助。 为什么我的测序这么慢? 人家做...