某动物皮肤单细胞Demo数据
2022年7月15日
Cluster plot​软件使用说明
2022年8月3日
软件依赖与安装

python,版本3.8及以上,下载地址:https://www.python.org/downloads/
相关模块:numpy,cv2,pandas,seaborn,sys,getopt
R及Rstudio安装,下载地址:https://cran.r-project.org/
相关R包安装:Seurat,dplyr,tibble,ggplot2

输入数据准备
matrix.mtx.gz,genes.tsv.gz(或 features.tsv.gz),和barcodes.tsv.gz
barcodes_pos.tsv.gz
HE图片

运行脚本

1)在Rstudio中打开seurat_for_bmkmanu_S1000.R脚本,修改参数初始化部分的参数
FilePath:输入路径,要求输入目录中必须包括matrix.mtx.gz,genes.tsv.gz(或 features.tsv.gz),和barcodes.tsv.gz文件
outdir:输出路径
res:选择不同的resolution值可以获得不同的cluster数目,值越大cluster数目越多,默认值是0.5
MinCell:过滤参数,细胞数
MinFeatures:过滤参数,基因数

2)运行seurat_for_bmkmanu_S1000.R脚本,得到聚类结果及marker gene
结果文件:
cluster.csv 聚类结果文件
marker_gene.csv marker基因文件
UMAP.pdf/png umap聚类图
t-SNE.pdf/png t-SNE聚类图
markers_heatmap.pdf/png marker gene热图

3)运行bmplot.py脚本,获得聚类图
python bmplot.py -e ./he.tif -p /path/to/posfile/barcodes_pos.tsv.gz -c /path/to/clsuter/file/cluster.csv -o ./out_cluster_st.tif
-e参数指定he图片文件
-p参数指定barcodes_pos.tsv.gz文件
-c参数指定上一步生成的cluster.csv文件
-o参数指定输出聚类图片文件名

结果文件:
out_cluster_st.tif 组织上的聚类图
4)运行marker_gene_Plot_rm_he.py脚本得到每个cluster中marker gene的表达量热图
python marker_gene_Plot_rm_he.py -e ./he.tif -i ./outdir/ -m marker_gene.csv -o outdir
-e参数指定he图片文件
-i参数指定输入目录,目录下必须包含barcodes_pos.tsv.gz,matrix.mtx.gz,features.tsv.gz文件
-m为第2)步得到的marker_gene.csv文件路径
-o为输出目录

结果文件

n_umi_dist.tif 每个cluster中marker gene的热图