一般作者都会把文章中可以公开的数据上传到公共数据库,可以根据项目编号去对应的数据库中下载,可以参考一下这篇文章:NCBI、ENA高通量测序数据下载-fastq数据
回答于 2025-02-27 09:28
同学,你下次问问题的时候不要重新开贴,直接在原文下面回答就可以,不然我们没法对应到你问题的上下文,还得去翻你的提问记录,这样很没有效率,你可以看一下提问的规范:提问规范,另外你说的报错如果还是你之前提到的no such file的问题,已经给你回答过了,是你没有正确读入变量名,你检查一下,你看下前面是不是有一条...
回答于 2025-02-24 10:04
你检查一下pairid文件里面的基因对有没有正常生成,如果只有一个基因是成不了对的,还有检查一下你的pep和cds文件,是不是正常的,如果你的基因序列没有提取成功,后面做分析的时候也会有问题
回答于 2025-02-19 11:26
你参数用的不对吧: tabix -p vcf vcf.gz
回答于 2025-02-19 11:15
不应该会有这种情况,如果你的PAV_gene.list文件里面有的话就会被拆出来的,你检查一下文件每一行是否都有换行符,我记得你上次的问题就是因为最后一行没有换行符?另外就是检查一下列与列之间是否是tab分割的。
回答于 2025-02-18 17:09
tsv和vcf不是两种特殊的文件类型,重点在于如果你要做后续的分析的话需要把文件整理成参考数据的格式,你这个是单一样本的结构变异结果吗,那你需要用SURVIVOR工具去做一个合并,把样本间相同的结构变异merge到一块,方便后续信息提取。
回答于 2025-02-18 09:41