- Mitochondrial: ^ZeamMp pattern (ZeamMp002, ZeamMp003, ...)
- Chloroplast/Plastid: ^ZemaCp pattern (ZemaCp002, ZemaCp003, ...)
# 玉米根尖单细胞转录组分析流程提示词
## 一、单细胞质控提示词
### 任务目标
请根据提供的 Cell Ranger 输出目录、样本信息表格及质控标准,生成 Shell 脚本 `02.data_QC.sh`。
### 背景信息
Cell Ranger 输出目录位于:`~/test/maize_root/01.cellranger`
样本信息表格内容如下,需要添加到 metadata 信息中:
| SampleID | Run | Accession | Group |
|----------|------|-------------|-------|
| CK1 | PU1 | CRR1070725 | CK |
| CK2 | PU2 | CRR1070726 | CK |
| HS1 | EW01 | CRR1070727 | HS |
| HS2 | EW02 | CRR1070728 | HS |
质控标准:
- 每个基因至少在 3 个细胞中表达(Seurat 参数:`min.cells = 3`)
- 每个细胞表达的基因数需在 200 到 9000 之间(`min.features = 200`,`nFeature_RNA < 9000`)
- 线粒体基因表达占比超过 10% 的细胞予以剔除,线粒体叶绿体基因特征参考:`/share/ref/Zea_mays/Zea_mays.B73_RefGen_v4.50.gff3.gz`
- 使用 DoubletFinder 进行 doublet 检测
### 注意事项
- 演示用,每个样本随机选取 1000 个细胞分析
- 非模式物种不需要分析细胞周期
- 要使用 `sc-qc` 这个 skill 完成

---
## 二、单细胞降维聚类提示词
### 任务目标
生成一个完整的 Shell 脚本,执行降维、分群和聚类分析,用户将手动运行。脚本文件名:`03.seurat_cluster.sh`。
### 背景信息
- 输入:`~/test/maize_root/02.data_QC/*doubletFinder.qs`
- 高变基因:vst 方法,选取前 2000 个
- 降维:PCA,基于 top2000 高变基因
- 聚类:选取前 30 个 PCs,分辨率参数 0.6
- 整合:harmony with `orig.ident`
### 注意事项
要使用 `sc-seurat-cluster` 这个 skill 完成。
| UMAP| tSNE |
|----------|----------|
|  |  |
---
## 三、细胞类型定义注释提示词 分成两步
### 3.1 观察数据
#### 任务目标
基于提供的细胞类型 marker 基因列表,完成以下两项任务,生成脚本:`04.cell_type_ann_step1.sh`。
1. 可视化展示各细胞类型 marker 基因在聚类中的表达情况
2. 分析并输出每个 cluster 高表达的基因列表
3. 细胞组成 `cell_bar_plot`(样本 `orig.ident`,细胞分组 `celltype`)
#### 背景信息
已知玉米根尖细胞类型及其 marker 基因如下:
| 细胞类型 | 基因 |
|----------|------|
| Phloem(韧皮部) | Zm00001d037032, Zm00001d042541 |
| Endodermis(内皮层) | Zm00001d050168, Zm00001d027500 |
| Pericycle(中柱鞘) | Zm00001d005472, Zm00001d052636 |
| Xylem(木质部) | Zm00001d035689, Zm00001d032672 |
| Stele(中柱) | Zm00001d021192, Zm00001d024281, Zm00001d031913, Zm00001d043523 |
| Epidermis(表皮) | Zm00001d032822, Zm00001d040090, Zm00001d032821, Zm00001d051860 |
| Initials(起始细胞) | Zm00001d040390, Zm00001d043413, Zm00001d003172 |
| Columella(根冠柱状细胞) | Zm00001d004089, Zm00001d001789 |
| Cortex(皮层) | Zm00001d017508, Zm00001d012081, Zm00001d047114 |
#### 步骤方法
读取 Seurat 对象(当前文件夹:`root_downsampled.qs` 格式)
**任务一:标记基因表达可视化**
- 绘制 `DimPlot` `seurat_clusters` 分布,`jjDotPlot` 和 `averageHeatmap` 展示 marker 基因对应的 `seurat_clusters`
- 绘制 `FeaturePlot` 或 `ViolinPlot`,展示关键 marker 基因的表达分布
**任务二:各 cluster 高表达基因分析**
- 使用 `FindAllMarkers` 函数,鉴定每个 cluster 相对于其他 cluster 的高表达基因
- 设置筛选阈值:`log2FC > 0.25`,`min.pct > 0.1`,`p_val_adj < 0.05`,top 10 基因
#### 注意事项
要使用 `sc-celltype-annotation` 这个 skill 完成。
| jjdotplot| FindAllMarkers |
|----------|----------|
|  |  |
---
### 3.2 完成细胞定义
#### 任务目标
根据已确认的 cluster-细胞类型对应关系,完成以下任务,生成 shell 脚本:`04.cell_type_ann_step2.sh`。
- 将细胞类型注释信息添加到 Seurat 对象中
- 展示 marker 基因在各细胞类型中的表达情况
- 绘制 celltype 对应 marker 基因的 `jjDotPlot` 和 `averageHeatmap`,细胞组成 `cell_bar_plot`(样本 `orig.ident`,细胞分组 `celltype`),`DimPlot`,`FindAllMarkers`,差异基因火山图:`celltypeDEGPlot`
#### 背景信息
已确认的 cluster 与细胞类型对应关系,输入文件:`root_downsampled.qs`
| seurat_clusters | celltype |
|-----------------|-------------|
| 0 | Epidermis |
| 1 | Cortex |
| 2 | Cortex |
| 3 | Epidermis |
| 4 | Columella |
| 5 | Stele |
| 6 | Cortex |
| 7 | Columella |
| 8 | Xylem |
| 9 | Stele |
| 10 | Initials |
| 11 | Cortex |
| 12 | Epidermis |
| 13 | Initials |
| 14 | Cortex |
| 15 | Stele |
| 16 | Pericycle |
| 17 | Phloem |
| 18 | Endodermis |
细胞类型对应基因:
| 细胞类型 | 基因 |
|----------|------|
| Phloem(韧皮部) | Zm00001d037032, Zm00001d042541 |
| Endodermis(内皮层) | Zm00001d050168, Zm00001d027500 |
| Pericycle(中柱鞘) | Zm00001d005472, Zm00001d052636 |
| Xylem(木质部) | Zm00001d035689, Zm00001d032672 |
| Stele(中柱) | Zm00001d021192, Zm00001d024281, Zm00001d031913, Zm00001d043523 |
| Epidermis(表皮) | Zm00001d032822, Zm00001d040090, Zm00001d032821, Zm00001d051860 |
| Initials(起始细胞) | Zm00001d040390, Zm00001d043413, Zm00001d003172 |
| Columella(根冠柱状细胞) | Zm00001d004089, Zm00001d001789 |
| Cortex(皮层) | Zm00001d017508, Zm00001d012081, Zm00001d047114 |
#### 注意事项
要使用 `sc-celltype-annotation` 这个 skill 完成。
| jjdotplot| FindAllMarkers |
|----------|----------|
|  |  |
---
## 四、Monocle2 拟时序提示词
### 任务目标
生成一个用于玉米柱状细胞 Monocle2 拟时序分析的 Shell 脚本 `05.monocle2.sh`,用户将手动运行。
### 背景信息
- 输入:`Columella.added.subtype.qs`(Seurat 对象)
- 分组列:`subtype`,批次矫正列名:`SampleID`
- KEGG 注释:`/share/ref/Zea_mays/annotations/kegg.gene2pathway.tsv`
- GO 注释:`/share/ref/Zea_mays/annotations/go.go_anno_result.tsv`
### 注意事项
要使用 `cell-trajectory-monocle2` 这个 skill 完成。
### 结果图片
| 选定排序基因 | 拟时序轨迹 |
|-------------|-----------|
|  |  |
| 状态分群 | 状态分群(拆分) |
|---------|---------------|
|  |  |
| DDRTree 拟时序 | DDRTree 状态 |
|---------------|-------------|
|  |  |
| 亚型分群 | 亚型分群(拆分) |
|---------|---------------|
|  |  |
| DDRTree 亚型 | 亚型密度 |
|-------------|---------|
|  |  |
| 拟时序表达变化基因 |
|-----------------|
|  |
| branch1分枝分析|
|-----------------|
|  |
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!
