你的上一步,bowtie应该报错了,你看看这个文件,$workdir/1.host_del_and_qc/cleandata/${i}.bowtie.map.log里面咋说的,是不是你的宿主文件写的不对?
回答于 2天前
不对,应该这样说,lda score, 代表的是一个物种在区分某组和其他组时的能力大小丰度很低低的lda score也高,只不过坏处事你不知道他到底是高还是低,所以可以结合那个丰度图看,就是不同组相对丰度的图
回答于 4天前
这个一般是分箱之后,每个属菌都去挖掘一下功能汇总一下,,然后这些功能和他们对应的这个功能类别,用桑基图连起来就行因为级别比较高,所以组装以后的数据注释一下,得到物种,功能对印关系也能做
回答于 4天前
他说的索引是这个RAPMAP格式,但是这个应该是老版本salmon的,你试试重新构建一下缩影,用这个1.9版本的,要是还有问题就去我们那个docker里跑这一步,有的时候依赖处理不了换个环境就好
回答于 2025-03-07 09:33
用data.table包的fread,读的很快,一百万行大概几秒就行如果数据再大,上亿行,就逐行读取吧
回答于 2025-03-03 11:16
KofamKOALA和付费购买整个数据库,对于pathway部分没啥区别eggnog侧重于进化关系来推功能,一般宏基因用这个结果会好一点,坏处是他的数据库老一点KofamKOALA用的hmm,特异性高,更严格 保守代谢途径基本差不多,物种特异的功能eggnog结果多一点,收费的一般用不上,对富集基本没影响
回答于 2025-02-27 16:48
当然可以,你这样是更有效率的,我这里用的是循环,所以资源占得少,后面应该会讲到并行,如果是并行运行的,资源会占得非常多,那就不建议这样操作了
回答于 2025-02-26 16:13
这个一般来说不用,你分两次处理那差异更大,后面更没有可比性了,单样本处理本来就不太关心大家的关联性的 如果是完全不相干的那直接分开做就行
回答于 2025-02-19 16:39