我想问一下,根据这段代码,我每个样要跑10个小时左右,总共270份样,怎么优化这个代码,减少所需时间

for i in S1A ; do > > echo "RUN CMD: gatk --java-options '-Xmx20g' HaplotypeCaller -R $REF \ > -I $workdir/3.map/result/${i}.sorted.dedup.bam \ > -O ${i}.g.vcf.gz --max-alternate-alleles 4 --sample-ploidy 2 \ > -ERC GVCF --tmp-dir $tmpdir" > > gatk --java-options "-Xmx20g" HaplotypeCaller -R $REF \ > -I $workdir/3.map/result/${i}.sorted.dedup.bam \ > -O ${i}.g.vcf.gz --max-alternate-alleles 4 --sample-ploidy 2 \ > -ERC GVCF --tmp-dir $tmpdir > done

请先 登录 后评论

1 个回答

Ti Amo

可以去了解一下HaplotypeCallerSpark得使用,对应修改脚本

请先 登录 后评论
  • 0 关注
  • 0 收藏,31 浏览
  • 不如 提出于 20小时前

相似问题