找到约 15 条结果

文章 qiime2分类器的训练

...增区命令: qiime feature-classifier extract-reads --i-sequences 99_otus.qza --p-f-primer ACTCCTACGGGAGGCAGCAG --p-r-primer GGACTACHVGGGTWTCTAAT --p-n-jobs 4 --o-reads ref-seqs.qza 仅保留细菌的代表序列命令: qiime taxa filter-seqs --i-sequences ref-seqs.qza --i-taxonomy 99_...

文章 借助perl脚本进行文件整理 | 将按第一列信息整理的文件改成按照第二列信息整理

...    Cred     A Cyellow  B有perl脚本如下:print "perl $0  <id_list> <out_file>\n" and die unless(@ARGV==2);open IN,"$ARGV[0]" or die "$!; can't open file $ARGV[0]\n";open OUT,">$ARGV[1]" or die "$!; can't open file $ARGV[1]\n";my%id;my%hash;while(<IN>){        cho...

问题 hmmer搜索提取结构域时出现错误

...为1e-20时,可以正常运行,这个是怎么回事? 我的HSP20_hmm_out.txt文件是 第二次搜索后的HSP20_domain_new_out_removed_redundant.txt文件为 用0.1来筛选获取序列出现错误。

问题 bioconductor一直安装不对

...进制版本的,但源代码版本是后来的: binary source needs_compilation lme4 1.1-31 1.1-32 TRUE Binaries will be installed trying URL 'https://cran.rstudio.com/bin/windows/contrib/4.2/lme4_1.1-31.zip' Content type 'application/zip' length 4525485 bytes (4.3 MB) downloa...

问题 请教:基因与mRNA的对应关系分析不正确

... 下面是gff文件的信息: rna文件信息如下,ID是以XM_开头。 protein文件信息如下,ID是以XP_开头。 对gff文件进行处理时,我用的两条命令是: #sed –i  's#gene-##' gff文件名 #sed –i  's#rna-##' gff文件名   然后,获取...

问题 利用gff文件提取基因结构,结果文件是空的

...d\n";my %gffs;while (<IN1>) {chomp;next if /^#/;my @b = split/\st/, $_;$gffs{$b[0]} = 1;}#print Dumper(\%gffs);while (<IN2>) {chomp;next if (/^#/);my @a = split /\t/, $_;next if $a[2]=~/exon/i;if ($a[2] =~/^mRNA$/i or $a[2] =~/^transcript$/i ) {($id1) =  ($a[8] =~ m/ID=([^;]*)/);}elsif ...

文章 gff文件格式不标准的修改脚本

...mRNA一致,mRNA的ID和Parent信息也会相同,可能会出错Scaffold_1 GLEAN gene 13403 73001 0.716366 - . ID=BTA000001.1;Scaffold_1 GLEAN mRNA 13403 73001 0.716366 - . ID=BTA000001.1;Parent=BTA000001.1;#正确Scaffold_1 G...

问题 vcftools --vcf GT_AGCT_Liujingyan.vcf --max-missing 0.5 --maf 0.05 --remove-indels -- min-alleles 2 --max-alleles 2 --minDP 2 --minQ 20 --recode -- stdout >SNP_filter_maf0.05_miss0.5.vcf在这基础上增加杂合率,激昂杂合率设为80%或者60%,如果是自交系或纯合体,杂合率设为10%-20%怎么改

问题 基因组注释 genome.chain 文件生成问题

... 16      U       100     scaffold        yes     proximity_ligation Chr15   30651847        40661077        17      W       ptg000026l:::fragment_1    1       10009231        + Chr16   1       7134318 1       W       ptg000026l:::fragment...

文章 多分组venn图绘制脚本

...library(venn)library(VennDiagram)library(purrr)# 读取命令行参数input_file <- args[1]output_prefix <- args[2]# 读取数据文件, 不转换列名venn_dat <- read.delim(input_file, check.names = FALSE)# 从文件中创建一个列表venn_list <- list(venn_dat[, 1], venn_dat[, 2], v...

问题 基因家族启动子顺势作用元件预测网站plantcare对昆虫适用嘛?

...因,中间没有终止密码子。 或者在命名的时候命名为9852_1, 9852_2?

问题 ANNOVAR变异注释报错:Erro: invalid record found in exonic_variant_function file (exonic format error)

老师您好, 我的输入代码: table_annovar.pl $workdir/4.snp_indel/var_qc/all.clean.snp.vcf.gz $refdir/test  \  -buildver unknown -out $workdir/5.var_ann/test/snp  \  -remove -protocol refGene -operation g -nastring . -vcfinput 报错所有信息:NOTICE: the --polish argument is s...

文章 绘制展示基因在样本中表达量与数量的柱状图

使用方法: Rscript lnc_exp.r -h usage: lnc_exp.r [-h] -i exp_data [-l legend.position] [-o outdir] [-p prefix] [-H height] [-W width] lnc_exp_Histogram:https://www.omicsclass.com/article/1552 optional arguments: -h, --help show this help message and exit -i exp_...

问题 使用NCBI下载的基因组和gff文件进行基因家族分析时,保留编码蛋白基因的命令似乎无法识别NCBI的gff文件(描述中为日志,图片为尝试获取的gff文件)

...]# cd $workdir [root@b3b8d8255335  13:06:34 /work/desaturase]# cd 01.data_prepare [root@b3b8d8255335  13:06:41 /work/desaturase/01.data_prepare]# ll total 0 -rwxr-xr-x 1 root root 152M Jul 23 16:04 Branchiostoma_floridae.fa.gz -rwxr-xr-x 1 root root  11K Jul 31 11:25 Branchiostoma_floridae.g...

问题 蛋白序列ID和cds序列ID不一致

... 下面是gff文件 获取基因与mRNA的对应关系perl script/mRNAid_to_geneid.pl Arabidopsis_thaliana.TAIR10.41.gff3 mRNA2geneID.txt,提取到的ID=Zm00001d027240_T001,而在hmm搜索的结果ID=Zm00001d027240_P001,在去除重复的hmmer搜索的转录本ID时,ID不一致,同时hmm...