2025-08-14 14:21 回答问题
一般来说是通用的,命令里带着一个接头的文件,如果你的引物不在里面,就加进去就行 /share/work/biosoft/Trimmomatic/Trimmomatic-0.39/adapters/my_adapter.fa
2025-08-13 10:34 回答问题
对的可以不过滤 本质上就是让预测出来的基因更完整 在contig长度较短然后总数不多的情况下,其实prodigal也可以不过滤的
2025-08-12 13:28 回答问题
平均质量过滤一般不用,过滤严格, 软件默认用的是质量过滤,就是按低于阈值的碱基比例来过滤,这个合理一点,一般用这个,默认值就可以,-q-u,这两个参数 但是如果你fastqc发现,绝大部分序列前面都很好,最后几个碱基质量很差,这个时候可以做滑动窗口过滤
2025-07-31 16:51 回答问题
你输一下 [root@d32fce929ab9 16:13:03 /work]# gtdbtk -h ...::: GTDB-Tk v2.4.1 :::... 看看出来的是不是这个版本, 我怀疑你没有加载上这个镜像,可以先把原来的镜像删掉的
2025-07-28 09:23 回答问题
因为组装的时候其实有组装质量的结果,n50那些,这些其实一定程度上可以代表结果质量 稀疏曲线一般不用在组装序列里,因为这种情况既和测序有关,又和组装质量有关 审稿人一般不太会问这个,如果问到了直接回复基因组覆盖率,或者组装质量什么的跟好一点
2025-07-22 14:39 回答问题
这个代码就是处理kegg和go的,输入文件不一样,但是整理成类似的就行 我之前在qq说统计的方法有说过 第一考虑功能在基因的占比,比如有20p的基因有这个功能, 第二是功能整体的占比 这个代码里就是第一种,这个没关系的,都可以用的,一般来说还是第一种更多一点,你也可以用已经得到的kegg的结果和文章的看一下,差的大不大
2025-07-21 11:46 回答问题
当然是正常的,数据库层级都是类似的,kegg会出现的问题其他地方也是一样的 按理说这个在文献肯定是不罕见的,你可以在看两篇,比如这个cazy 的,他一般是按结构域分的,一个蛋白可能有多个结构域,所以重叠一下是很正常的 lda 的时候没注视到的基因一般是删除,因为没有功能就没有后续,删掉也可以简化解释, 但是如果本来就后面不做了,那删不删都随意了,
2025-07-21 09:45 回答问题
对的,cds比较长,回比的时候会考虑长度的,做后续分析的时候如果样本量大可以自己手动4舍5入,基本不影响的 如果样本量很小,很多cds丰度不到10 的级别,就用tximport处理一下,一般不至于
2025-06-30 11:01 发表了文章
2025-05-30 16:40 发表了文章