找到约 15 条结果

文章 单细胞转录组数据挖掘流程记录-结直肠癌 CRC(GSE178341)

...SE178341/suppl/GSE178341%5Fcrc10x%5Ffull%5Fc295v4%5Fsubmit.h5" -O GSE178341_crc10x_full_c295v4_submit.h5 wget -c "https://ftp.ncbi.nlm.nih.gov/geo/series/GSE178nnn/GSE178341/suppl/GSE178341%5Fcrc10x%5Ffull%5Fc295v4%5Fsubmit%5Fcluster.csv.gz" -O GSE178341_crc10x_full_c295v4_submit_cluster.csv.gz wg...

文章 多组学联合分析—桑基图

...CRAN/" options(repos=r)}) # 依赖包列表:自动加载并安装 package_list <- c("ggplot2","ggsankey","dplyr","tidyr","viridis") # 判断R包加载是否成功来决定是否安装后再加载 for(p in package_list){ if(!suppressWarnings(suppressMessages(require(p, character.only = TRUE, q...

文章 SNP2CAPS使用

...为CAPS标记,其具体用法: perl SNP2CAPS.pl   chr5D:9950377.fa_1    link_gcg    AanI,AarI,AasI,AatII,Aba6411II,AbaB8342IV,AbaCIII   > chr5D:9950377.txt 其中chr5D:9950377.fa_1为SNP两端各150bp的序列;link_gcg限制性内切酶数据库;之后为分析用到的限制...

问题 TCGA数据生存时间怎么确定?

...床数据,但是怎么得到生存时间,用哪个数据? [1] "bcr_patient_barcode"                         "additional_studies"                           [3] "tissue_source_site"                          "patient_id"                       ...

文章 单细胞转录组数据挖掘流程记录-BRCA乳腺癌(GSE161529)

....ncbi.nlm.nih.gov/geo/download/?acc=GSE161529&format=file" -O GSE161529_RAW.tar wget -c "https://ftp.ncbi.nlm.nih.gov/geo/series/GSE161nnn/GSE161529/suppl/GSE161529%5Ffeatures.tsv.gz" -O GSE161529_features.tsv.gz​ #解压 tar xvf GSE161529_RAW.tar #由于数据是分开的,并且是10X的...

文章 perl中判断数组中是否含有某个元素

...和一个列表。 对于列表中的每个元素,它的值会被赋到$_(Perl的标量默认值), 然后执行代码块。如果代码块的返回值是false,相应值被丢弃。如果代码块返回值是true, 相应值会作为返回值之一。 注意:代码块和第二个参数间...

问题 测序文件中提取基因序列

从公共数据库中的下载的二代基因组测序文件(双端测序:.fastq_1,.fastq_2文件),下载后多个样本后,如何从这些测序文件中提取特定某个基因序列信息进行后续分析特异性分析。

问题 请问老师用McscanX做基因组内共线性分析,在准备family.ctl文件时,对染色体编号有撒要求没,我的染色体编号中还有chrA01,chrC01,以及chrA01_random,以及 chrAnn_random,我看有人说染色体编号只能有2个字母加数字,谢谢!

问题 (ERR): "--dta" does not exist Exiting now ...为什么hisat2有这个选项却报错

直接下载的是clean_data所以跳过质控直接做map,修改了代码如下 for i in SRR9113321 SRR9113322 SRR9113323 SRR9113324 SRR9113325 SRR9113326 SRR9113327 SRR9113328 SRR9113329 SRR9113330 SRR9113331 SRR9113332 SRR9113333; do echo "RUN CMD: hisat2 -p 1 --rg-id=${i} --rg SM:${i} --rg L...

文章 Scanpy数据结构:AnnData

...存储其他未排序的数据和元信息 AnnData object with n_obs × n_vars = 6050 × 32285 obs: 'in_tissue', 'array_row', 'array_col', 'gender', 'age', 'tissue', 'Strain', 'n_genes_by_counts', 'log1p_n_genes_by_counts', 'total_counts', 'log1p_total_counts', 'pct_counts_in_top_50_g...

问题 gff文件基因名重命名

老师您好,我想把我的gff文件中的文件名修改成下图格式,怎么操作?"物种简称_染色体号_000001" gene为G,其他为T

问题 老师您好,我在做泛基因家族分析中存在缺失分析得到的基因家族泛基因编号文件和泛基因列表一样,不知道为什么

... 下一步是获得该家族基因的泛基因编号,grep -f foxtail_millet.GRASgene.list foxtail_millet.pan-genes.list|sort|uniq > foxtail_millet.GRASgene.pan-genes.list 下面是结果,但该文件和上面 foxtail_millet.pan-genes.list文件大小一模一样,不知道是为什么...

文章 构建一致性序列

构建一致性序列方法如下: 1.将vcf文件压缩 bgzip -c  raw.filtered.snp.vcf > raw.filtered.snp.vcf.gz 2.建立索引 tabix raw.filtered.snp.vcf.gz 3.构建一致性序列 bcftools consensus -f Ghirsutum_527_v2.0.fa raw.filtered.snp.vcf.gz > new.fa

问题 TCGA下载数据保存

下载FPKM的时候,保存结果时出现Error in read_connection_(con) : Evaluation error: error reading from the connection. In addition: Warning message: In (function (con, what, n = 1L, size = NA_integer_, signed = TRUE,  :   invalid or incomplete compressed data

问题 进行宏基因组分析组装这一部分,比对 reads,生成未比对 BAM 文件时很慢

...rk/demo/4.assemble/megahit/${i}/${i}.contigs.fa.min \   /work/demo/1.host_del_and_qc/cleandata/${i}_1.fastq \   /work/demo/1.host_del_and_qc/cleandata/${i}_2.fastq \ | samtools view -@ 12 -b -f 12 -o /work/demo/4.assemble/megahit/${i}/${i}_unmap.bam -后出现下面这个,这个太慢了吧...