GATK CALL 变异后导入GenomicsDBImport 出现问题

在用GATK CALL 变异后生成的g.vcf.gz文件用GATK的GenomicsDBImport工具导入db的时候出现了问题。我用的命令是:gatk  --java-options "-Xmx50g" GenomicsDBImport  \

  -L intervals.list  --tmp-dir $tmpdir  -R $REF --batch-size 5 \

  --reader-threads 5 --max-num-intervals-to-import-in-parallel 5 \

  --genomicsdb-workspace-path db --sample-name-map cohort.sample_map。(

intervals.list是12条染色体的列表)。运行的时候报错如下: GenomicsDBImport cannot use multiple VCF reader threads for initialization when the number of intervals is greater than 1. Falling back to serial VCF reader initialization。尝试了很多次,都不行。


请先 登录 后评论

2 个回答

Ti Amo

直接运行之后就终止了吗?还是出现这个信息之后他还在运行?
GATK作者有关于这个问题的回复:GenomicsDBImport cannot use multiple VCF reader threads for initialization when the number of intervals is greater than 1. Falling back to serial VCF reader initialization. – GATK
attachments-2025-08-JeHbhcxQ68902dc32b5c5.png

请先 登录 后评论
郭老师

出现这个之后就终止了。然后我将线程设为1,重新跑一遍,很快就结果了,只有第一条染色体的,感觉结果也是不完成整的。这是db文件夹中的:

drwx------ 4 root root  4096 Aug  4 11:54 Chr1$1$48169259

-rwx------ 1 root root     0 Aug  4 11:54 __tiledb_workspace.tdb

-rwx------ 1 root root 17409 Aug  4 11:54 vcfheader.vcf

-rwx------ 1 root root  3417 Aug  4 11:54 vidmap.json

请先 登录 后评论