找到约 15 条结果

文章 OTUtable标准化方法

...zed_otu_table.biom -o  normalized_otu_css/CSS_normalized_otu_table1.txt --to-tsv --header-key taxonomy#去掉只有界注释的OTUgrep -v 'k; _; _; B; a; c; t; e; r; i; a'  normalized_otu_css/CSS_normalized_otu_table1.txt >normalized_otu_css/CSS_normalized_otu_table.txt#注意biom格式转变 j...

文章 GATK Hard-filter 过滤变异结果推荐阈值

...征值(annotation values)统计分布 One of the most helpful ways to approach hard-filtering is to visualize the distribution of annotation values for a truth set called using a particular pipeline. These distributions are sharped by both the pipeline methodology and the underlying physical ...

文章 提取miRNA前后500bp序列

...r:-id         blast.out                    <infile>     must be given-out          outfile                        <outfile>        must be given-fa genome fasta file <infile>must be given                 -miR...

问题 Linux安装anaconda后,加载镜像包,提示失败

...  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main zsh: no such file or directory: https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main manager@bl8vbox[manager]   - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free zsh: no such file or directory: https://mirrors.tuna.tsinghua...

问题 如果提取基因一条代表CDS序列不成功,mRNA与CDS,GENE的ID都不一致(马铃薯数据库)

...ID,但提取的是mRNA的ID 所以我想修改perl脚本(geneid_to_mRNAid.pl) 当我把if($tmp[2] =~/mRNA中的mRNA改为cds时, 显示 当我把里面的全部mRNA全都改为cds时 显示   请问该如何修改脚本,可以得到基因对应cds的 ID呢 ...

文章 进化树中bootstrap值设置

...le=numeric设置bootstrap值的显示类型值为[numeric,rect,circle,star,check,triangle]中的一个;默认为numericsize=10设置bootstrap值的字号或形状的直径取值为0或整数,默认为10color=red or color=red:blue设置bootstrap值的填充色或形状的边框色取值为颜色...

问题 基因组注释 ,seqclean软件报错

... seqclean all_transcripts.fasta -c 10 -n 10000 -v ./UniVec  Standard log file: seqcl_all_transcripts.fasta.log  Error log file:    err_seqcl_all_transcripts.fasta.log  Using 10 CPUs for cleaning -= Rebuilding all_transcripts.fasta cdb index =-  Launching actual cleaning process:  psx -p...

文章 grep 同时满足多个关键字和满足任意关键字

...的方式。 搜索任意关键字 ① grep -E "word1|word2|word3"   file.txt    满足任意条件(word1、word2和word3之一)将匹配。 同时满足多个关键字 ② grep word1 file.txt | grep word2 |grep word3    必须同时满足三个条件(word1、word2和word3)...

文章 STAR比对软件的使用

...dobin/STAR/archive/2.7.3a.tar.gz tar -xvzf 2.7.3a.tar.gz cd STAR/source make STAR 2. STAR的使用 分为两部分:建索引和序列比对 (1)建索引 STAR --runThreadN 6 \ --runMode genomeGenerate \ --genomeDir GRCm38 \ --genomeFastaFiles GRCm38.p5.genome.fa  \ --sjdbGTFfile...

文章 单细胞转录组数据挖掘流程记录-UM葡萄膜黑色素瘤(GSE139829)

...et -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE139829&format=file" -O GSE139829_RAW.tar #解包 tar xvf GSE139829_RAW.tar #不同批量重命名文件,并连接到不同文件夹 ​for i in BSSR0022 UMM041L UMM059 UMM061 UMM062 UMM063 UMM064 UMM065 UMM066 UMM067L UMM069;do mkdi...

文章 单细胞转录组数据挖掘流程记录-BRCA乳腺癌(GSE161529)

...et -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE161529&format=file" -O GSE161529_RAW.tar wget -c "https://ftp.ncbi.nlm.nih.gov/geo/series/GSE161nnn/GSE161529/suppl/GSE161529%5Ffeatures.tsv.gz" -O GSE161529_features.tsv.gz​ #解压 tar xvf GSE161529_RAW.tar #由于数据是分开的...

文章 分离NR NT库,快速blast本地比对同源注释基因

... 17 MB and contains two columns: the protein's gi and taxid. #Divisions file (division.dmp): # division id -- taxonomy database division id # division cde -- GenBank division code (three characters) # division name -- e.g. BCT, PLN, VRT, MAM, PRI... # comments #0 | BCT ...

问题 老师您好,docker镜像加速后,下载你们的gwas镜像时,总是pull了一半,剩下的立刻就没反应了,尝试了几十次,这个怎么回事?

...ng production.cloudflare.docker.com:443 with direct connection: connecting to 104.18.122.25:443: dial tcp 104.18.122.25:443: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has...

文章 Mapchart绘制基因染色体位置图

...例数据。 下载时需进行注册,提交邮箱信息方便license file文件下载,并将下载的MapChart.lic添加到安装路径,以免影响软件使用。 准备数据 整理染色体的名称、长度信息,以及染色体上需要标注的基因的位置信息,只需要填写...

文章 1000G千人基因组计划人群缩写对照表

...来源:http://www.internationalgenome.org/faq/which-populations-are-part-your-study/