找到约 15 条结果

文章 非小细胞肺癌(GSE123904)

数据下载: wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE123904&format=file" -O GSE123904_RAW.tartar xvf GSE123904_RAW.tar 准备map.txt文件: LX653PRIMARY_TUMOURLX676PRIMARY_TUMOURLX682PRIMARY_TUMOURLX699METASTASISLX661PRIMARY_TUMOURLX255BMETASTASISLX682NORMALLX7...

文章 R语言基础入门—数据结构(1)

...为生信分析最常用的编程语言之一,经常被用于进行生物数据统计分析和绘图。之前小编给大家介绍了R语言下载安装和一些基础概念,今天继续介绍R语言的数据结构。 R语言数据结构包括向量,矩阵和数据框,数组, 列表,因...

问题 重测序

我现在在做重测序数据比对和call SNP 分析,有个问题我想咨询一下:每个测序序列生成的g.vcf.gz的文件比较大,所用能一下子生成所有的g.vcf.gz文件,所以只能先生成一部分g.vcf.gz文件进行合并成vcf.gz文件,然后在生成另外一部分...

问题 sam 转换成bam 格式并排序时,没转换成功。reads 与基因组进行比对map这里出错。

老师,我利用demo数据进行转录组分析。 在尝试将demo的数据,将sam 转换成bam 格式并排序时并没有转换成功。不太清楚哪里出了问题。 我不知道demo数据是否是链特异性文库,所以也就没去设置(RF or FR)。也不会设置。 所以...

问题 共线性分析 视频介绍的不详细

这两个应该是同一类型问题,biosoft/miniconda/miniconda2/bin/python和/biosoft/MCScanX/MCScanX/MCScanX mcscan/AT这个路径进不去,是有权限吗还是怎么样,还有wget所获得的数据时这两个是什么数据别的物种家族该从哪获得?

文章 绘制生存曲线图

...可以绘制一个单因素的生存曲线图。 # 表达信息和生存数据整合到 exprSet, 其格式如下: bcr_patient_barcode time status LINC01587 XXbac_B461K10.4 1 TCGA-2W-A8YY 148 0 3.981761 23.89057 2 TCGA-4J-AA1J 226 0 37.491171 19.63823 3 ...

文章 NCBI下载的10X单细胞数据只有read1和read2如何读入cellranger

10x的数据可以使用 cellranger mkfastq 产生,下面的例子是两个样本同一个lane测序拆分后分析;第二个例子是同一个样本两个lane测序,需要合并一起分析; 大家注意文件命名方式,蓝色和红色部分; cellranger命名规则 : https://supp...

文章 计算Kaks时批量提取多对基因的序列

...简单快速,学习链接:基因家族分析实操课程 2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读 3. 转录组数据深入挖掘技能-WGCNA,...

问题 无参转录组里的回比率问题

我做了个无参考基因组昆虫的转录组,公司先对所有样品的数据进行了拼接,形成一个unigene库,然后再把每个样品的数据回比到unigene库上,得到一个回比率,我这里是55%,感觉有点低啊,什么原因造成的呢?

文章 EggNOG基因序列批量注释

...s Groups)是基于直系同源蛋白进行分组比对的一个公共资源数据库,由EMBL维护,提供了不同分类水平蛋白的直系同源分组(Orthologous Groups ,OG),包括真核物种、原核物种及病毒的数据信息。数据库对每个同源基因类进行了系统...

文章 桑基图绘制

...图是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。 载入数据 rm(list=ls())data("iris")iris$Class...

问题 NGS数据分析时,使用ANNOVAR的table_annovar.pl报错。

使用自建数据库。用ANNOVAR的annotate_variation.pl进行注释时,没有报错。 [*****@head ****]$ perl ../tessDSS/annovar/annotate_variation.pl -geneanno -buildver HP ./bin/M5-31.avinput HPdb/NOTICE: Output files are written to ./bin/M5-31.avinput.variant_function, ./bin/M5-31.avinput....

文章 SNP分析中由于基因组序列过长导致报错解决方法

...简单快速,学习链接:基因家族分析实操课程 2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读 3. 转录组数据深入挖掘技能-WGCNA,...

文章 基因组组装质量评估

...的覆盖程度。一般需要借助RNA方面的证据进行评估,如EST数据或RNA reads。由于用来评估的RNA方面证据不同,得到的比例也会有差别。一般来说,50%的scaffold覆盖基因的95%以上,85%的scaffold覆盖基因的90%以上,认为组装较完整。 3. ...

问题 vcf合并

...的课程。我在分析的时候遇到了vcf文件合并的困难。我的数据是两部分组成的,一部分是自己测的,现在做到gvcf了,还有一部分是从已发表的文章中的vcf文件里提取出来一部分,参考基因组是相同。我的困难是怎么把这两部分...