单细胞转录组质控提示词

单细胞质控提示词

- Mitochondrial: ^ZeamMp pattern (ZeamMp002, ZeamMp003, ...)

  - Chloroplast/Plastid: ^ZemaCp pattern (ZemaCp002, ZemaCp003, ...)


# 玉米根尖单细胞转录组分析流程提示词


## 一、单细胞质控提示词


### 任务目标


请根据提供的 Cell Ranger 输出目录、样本信息表格及质控标准,生成 Shell 脚本 `02.data_QC.sh`。


### 背景信息


Cell Ranger 输出目录位于:`~/test/maize_root/01.cellranger`


样本信息表格内容如下,需要添加到 metadata 信息中:


| SampleID | Run  | Accession   | Group |

|----------|------|-------------|-------|

| CK1      | PU1  | CRR1070725  | CK    |

| CK2      | PU2  | CRR1070726  | CK    |

| HS1      | EW01 | CRR1070727  | HS    |

| HS2      | EW02 | CRR1070728  | HS    |


质控标准:


- 每个基因至少在 3 个细胞中表达(Seurat 参数:`min.cells = 3`)

- 每个细胞表达的基因数需在 200 到 9000 之间(`min.features = 200`,`nFeature_RNA < 9000`)

- 线粒体基因表达占比超过 10% 的细胞予以剔除,线粒体叶绿体基因特征参考:`/share/ref/Zea_mays/Zea_mays.B73_RefGen_v4.50.gff3.gz`

- 使用 DoubletFinder 进行 doublet 检测


### 注意事项


- 演示用,每个样本随机选取 1000 个细胞分析

- 非模式物种不需要分析细胞周期

- 要使用 `sc-qc` 这个 skill 完成


![其中一个样本质控结果](02.data_QC/HS1.afterQC_histogram.png "质控结果示例")    


---


## 二、单细胞降维聚类提示词


### 任务目标


生成一个完整的 Shell 脚本,执行降维、分群和聚类分析,用户将手动运行。脚本文件名:`03.seurat_cluster.sh`。


### 背景信息


- 输入:`~/test/maize_root/02.data_QC/*doubletFinder.qs`

- 高变基因:vst 方法,选取前 2000 个

- 降维:PCA,基于 top2000 高变基因

- 聚类:选取前 30 个 PCs,分辨率参数 0.6

- 整合:harmony with `orig.ident`


### 注意事项


要使用 `sc-seurat-cluster` 这个 skill 完成。


| UMAP| tSNE |

|----------|----------|

| ![umap](03.seurat_cluster/maize_root.harmony/maize_root.harmony.umapDimPlot.png "UMAP")    | ![tSNE](03.seurat_cluster/maize_root.harmony/maize_root.harmony.tsneDimPlot.png "tSNE") |


---


## 三、细胞类型定义注释提示词 分成两步


### 3.1 观察数据


#### 任务目标


基于提供的细胞类型 marker 基因列表,完成以下两项任务,生成脚本:`04.cell_type_ann_step1.sh`。


1. 可视化展示各细胞类型 marker 基因在聚类中的表达情况

2. 分析并输出每个 cluster 高表达的基因列表

3. 细胞组成 `cell_bar_plot`(样本 `orig.ident`,细胞分组 `celltype`)


#### 背景信息


已知玉米根尖细胞类型及其 marker 基因如下:


| 细胞类型 | 基因 |

|----------|------|

| Phloem(韧皮部) | Zm00001d037032, Zm00001d042541 |

| Endodermis(内皮层) | Zm00001d050168, Zm00001d027500 |

| Pericycle(中柱鞘) | Zm00001d005472, Zm00001d052636 |

| Xylem(木质部) | Zm00001d035689, Zm00001d032672 |

| Stele(中柱) | Zm00001d021192, Zm00001d024281, Zm00001d031913, Zm00001d043523 |

| Epidermis(表皮) | Zm00001d032822, Zm00001d040090, Zm00001d032821, Zm00001d051860 |

| Initials(起始细胞) | Zm00001d040390, Zm00001d043413, Zm00001d003172 |

| Columella(根冠柱状细胞) | Zm00001d004089, Zm00001d001789 |

| Cortex(皮层) | Zm00001d017508, Zm00001d012081, Zm00001d047114 |


#### 步骤方法


读取 Seurat 对象(当前文件夹:`root_downsampled.qs` 格式)


**任务一:标记基因表达可视化**


- 绘制 `DimPlot` `seurat_clusters` 分布,`jjDotPlot` 和 `averageHeatmap` 展示 marker 基因对应的 `seurat_clusters`

- 绘制 `FeaturePlot` 或 `ViolinPlot`,展示关键 marker 基因的表达分布


**任务二:各 cluster 高表达基因分析**


- 使用 `FindAllMarkers` 函数,鉴定每个 cluster 相对于其他 cluster 的高表达基因

- 设置筛选阈值:`log2FC > 0.25`,`min.pct > 0.1`,`p_val_adj < 0.05`,top 10 基因


#### 注意事项


要使用 `sc-celltype-annotation` 这个 skill 完成。



| jjdotplot| FindAllMarkers |

|----------|----------|

| ![jjdotplot](04.cell_type_ann_step1/Marker.seurat_clusters.jjDotPlot.png "jjdotplot")    | ![FindAllMarkers](04.cell_type_ann_step1/FindAllMarkers.Top10allClusterMarkerGeneHeatmap.png "FindAllMarkers") |





---


### 3.2 完成细胞定义


#### 任务目标


根据已确认的 cluster-细胞类型对应关系,完成以下任务,生成 shell 脚本:`04.cell_type_ann_step2.sh`。


- 将细胞类型注释信息添加到 Seurat 对象中

- 展示 marker 基因在各细胞类型中的表达情况

- 绘制 celltype 对应 marker 基因的 `jjDotPlot` 和 `averageHeatmap`,细胞组成 `cell_bar_plot`(样本 `orig.ident`,细胞分组 `celltype`),`DimPlot`,`FindAllMarkers`,差异基因火山图:`celltypeDEGPlot`


#### 背景信息


已确认的 cluster 与细胞类型对应关系,输入文件:`root_downsampled.qs`


| seurat_clusters | celltype    |

|-----------------|-------------|

| 0               | Epidermis   |

| 1               | Cortex      |

| 2               | Cortex      |

| 3               | Epidermis   |

| 4               | Columella   |

| 5               | Stele       |

| 6               | Cortex      |

| 7               | Columella   |

| 8               | Xylem       |

| 9               | Stele       |

| 10              | Initials    |

| 11              | Cortex      |

| 12              | Epidermis   |

| 13              | Initials    |

| 14              | Cortex      |

| 15              | Stele       |

| 16              | Pericycle   |

| 17              | Phloem      |

| 18              | Endodermis  |


细胞类型对应基因:


| 细胞类型 | 基因 |

|----------|------|

| Phloem(韧皮部) | Zm00001d037032, Zm00001d042541 |

| Endodermis(内皮层) | Zm00001d050168, Zm00001d027500 |

| Pericycle(中柱鞘) | Zm00001d005472, Zm00001d052636 |

| Xylem(木质部) | Zm00001d035689, Zm00001d032672 |

| Stele(中柱) | Zm00001d021192, Zm00001d024281, Zm00001d031913, Zm00001d043523 |

| Epidermis(表皮) | Zm00001d032822, Zm00001d040090, Zm00001d032821, Zm00001d051860 |

| Initials(起始细胞) | Zm00001d040390, Zm00001d043413, Zm00001d003172 |

| Columella(根冠柱状细胞) | Zm00001d004089, Zm00001d001789 |

| Cortex(皮层) | Zm00001d017508, Zm00001d012081, Zm00001d047114 |


#### 注意事项


要使用 `sc-celltype-annotation` 这个 skill 完成。


| jjdotplot| FindAllMarkers |

|----------|----------|

| ![jjdotplot](04.cell_type_ann_step2/Marker.seurat_clusters.jjDotPlot.png "jjdotplot")    | ![FindAllMarkers](04.cell_type_ann_step2/ "FindAllMarkers") |


---

## 四、Monocle2 拟时序提示词


### 任务目标


生成一个用于玉米柱状细胞 Monocle2 拟时序分析的 Shell 脚本 `05.monocle2.sh`,用户将手动运行。


### 背景信息


- 输入:`Columella.added.subtype.qs`(Seurat 对象)

- 分组列:`subtype`,批次矫正列名:`SampleID`

- KEGG 注释:`/share/ref/Zea_mays/annotations/kegg.gene2pathway.tsv`

- GO 注释:`/share/ref/Zea_mays/annotations/go.go_anno_result.tsv`


### 注意事项


要使用 `cell-trajectory-monocle2` 这个 skill 完成。


### 结果图片


| 选定排序基因 | 拟时序轨迹 |

|-------------|-----------|

| ![选定排序基因](05.monocle2/01.selected_order_gene.png) | ![拟时序轨迹](05.monocle2/02.Pseudotime.png) |


| 状态分群 | 状态分群(拆分) |

|---------|---------------|

| ![状态分群](05.monocle2/03.State.png) | ![状态分群拆分](05.monocle2/03.State.split.png) |


| DDRTree 拟时序 | DDRTree 状态 |

|---------------|-------------|

| ![DDRTree拟时序](05.monocle2/04.DDRTree.Pseudotime.png) | ![DDRTree状态](05.monocle2/04.DDRTree.State.png) |


| 亚型分群 | 亚型分群(拆分) |

|---------|---------------|

| ![亚型分群](05.monocle2/05.subtype.png) | ![亚型分群拆分](05.monocle2/05.subtype.split.png) |


| DDRTree 亚型 | 亚型密度 |

|-------------|---------|

| ![DDRTree亚型](05.monocle2/06.DDRTree.subtype.png) | ![亚型密度](05.monocle2/08.subtype.density.png) |


| 拟时序表达变化基因 |

|-----------------|

| ![差异基因热图聚类](05.monocle2/10.Pseudotime_differentialGene_heatmap_cluster.png) |



| branch1分枝分析|

|-----------------|

| ![branch1](05.monocle2/branch1/branch.sigBEAM_diff_genes_heatmap.png) |


  • 发表于 1天前
  • 阅读 ( 46 )
  • 分类:转录组

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

787 篇文章

作家榜 »

  1. omicsgene 787 文章
  2. 安生水 372 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 97 文章
  6. rzx 88 文章
  7. 红橙子 81 文章
  8. Ti Amo 78 文章