2天前 回答问题
因为组装的时候其实有组装质量的结果,n50那些,这些其实一定程度上可以代表结果质量 稀疏曲线一般不用在组装序列里,因为这种情况既和测序有关,又和组装质量有关 审稿人一般不太会问这个,如果问到了直接回复基因组覆盖率,或者组装质量什么的跟好一点
2025-07-22 14:39 回答问题
这个代码就是处理kegg和go的,输入文件不一样,但是整理成类似的就行 我之前在qq说统计的方法有说过 第一考虑功能在基因的占比,比如有20p的基因有这个功能, 第二是功能整体的占比 这个代码里就是第一种,这个没关系的,都可以用的,一般来说还是第一种更多一点,你也可以用已经得到的kegg的结果和文章的看一下,差的大不大
2025-07-21 11:46 回答问题
当然是正常的,数据库层级都是类似的,kegg会出现的问题其他地方也是一样的 按理说这个在文献肯定是不罕见的,你可以在看两篇,比如这个cazy 的,他一般是按结构域分的,一个蛋白可能有多个结构域,所以重叠一下是很正常的 lda 的时候没注视到的基因一般是删除,因为没有功能就没有后续,删掉也可以简化解释, 但是如果本来就后面不做了,那删不删都随意了,
2025-07-21 09:45 回答问题
对的,cds比较长,回比的时候会考虑长度的,做后续分析的时候如果样本量大可以自己手动4舍5入,基本不影响的 如果样本量很小,很多cds丰度不到10 的级别,就用tximport处理一下,一般不至于
2025-06-30 11:01 发表了文章
2025-05-30 16:40 发表了文章
2025-05-27 15:50 回答问题
beta多样性分析,常用的距离比如bray不需要抽平,如果要用欧式距离就抽吧alpha多样性要抽平,抽平数据和相对丰度没有本质区别,前者会损失数据,所以要看损失的多少决定用不用功能分析用那个tpm 的,不抽平
2025-05-27 11:21 回答问题
bracken原本就是对kraken 的结果的一种修饰,比如一些只分到genus 的级别的片段,他其实应该分到物种,简单来说braken就是按照贝叶斯算法把这些片段的丰度按比例加到种级别类似的,具体的工作原理你可以看一下bracken的那个文章Lu J, Breitwieser FP, Thielen P, Salzberg SL. 2017. Bracken: estimating species abundance in metagenomics data. PeerJ Computer Science
2025-05-13 16:52 回答问题
这个beta.sh是一个简化的shell代码,这个beta多样性分析和物种那边的beta多样性分析是一样的,你可以一步一步执行看看是哪里报错的beta.sh可以直接打开来看
2025-04-28 16:09 发表了文章