omicsgene
omicsgene - 生物信息
实名认证 专业认证

性别: 北京 - 北京市 注册于 2018-04-20

擅长:重测序,遗传进化,转录组,GWAS

生物信息

向TA求助
14702金币数
83160 经验值
454个粉丝
主页被访问 95690 次

4143 个回答

0 赞同

重测序

对的内存目前只用用了 15G; 任务不一定一直用这么多内存和CPU,是动态变化的,你要观察每个任务从开始到结束整个过程内存和CPU使用峰值才行; 盲目的加任务,当任务都达到峰值就会让系统崩溃;

回答于 2025-01-09 14:11

0 赞同

重测序

每个100%就是一个CPU;  最上面有每个CPU的使用情况;

回答于 2025-01-09 14:00

0 赞同

老师,gff文件保留最长转录本有蓝色那一行的可以输出成功,上面...

蓝色那一行不影响结果; 没出结果那个基因有注释CDS吗?你看看第三列;

回答于 2025-01-08 13:54

0 赞同

重测序

linux基础不好建议学习学习linux基础课:https://bdtcd.xetlk.com/s/17gwqZ 下面的这个代码你运行一下,打印每个样本的任务,到 gatk.sh for i in $(cat $workdir/data/data.txt); do  echo "gatk --java-options '-Xmx100g' HaplotypeCaller -R $REF   \    -I $workdir/3.map/result/${i}.sorted.dedup.bam \    -O ${i...

回答于 2025-01-08 13:47

0 赞同

重测序

ParaFly 这个命令要求sh文件里面一行是一个任务,不必要的注释换行符变量等需要删掉; 建议吧命令用for循环结合echo打印出来,手动编辑命令的sh文件再批量运行: 可以学习学习Linux基础:https://www.omicsclass.com/article/1006 实在不会就所有的输入输出文件用绝对路径,手动编辑命令文件;

回答于 2025-01-08 10:44

0 赞同

基因家族分析

联系客服处理:点击联系客服

回答于 2025-01-07 17:19

0 赞同

重测序

一般内存你尽量多设置一些,任务需要多少内存那个命令代码会自己处理,你不需要考虑那么多;你关心你所有任务总的内存使用情况即可,内存爆了,你减少任务量即可;  有些情况自己多跑任务,慢慢积累经验就知道了;

回答于 2025-01-07 12:32

0 赞同

重测序

自己试试就知道了,不同配置的机器不一样, 后台运行了任务,你htop 观察一下内存和cpu使用情况即可; 满了卡死了,就杀死任务重新来;

回答于 2025-01-07 12:27

0 赞同

老师 我想问一下就是这个snp的统计是哪里呀 我视频里面看啦 说...

gz 压缩文件不能直接wc -l 统计行数,需要解压才行: zcat vcf.gz|wc -l 我不知道你怎么统计的,重测序数据多基因组大,百万级甚至千万级SNP数量也正常吧;

回答于 2025-01-07 10:16

0 赞同

重测序

你还要考虑子任务的内存和cpu的使用情况,比如说你一个任务消耗 10G,50个任务就是500G,每个任务是4个线程,50个并行就是200个cpu; 这样写可以的: nohup ParaFly -c  w.sh -CPU 50 > w.sh.o&

回答于 2025-01-06 17:28