数据质控报告
1 测序reads统计
测序reads统计如下表:
表1 测序数据统计
Type | Values |
---|---|
Number of Reads | XXX |
Reads with Valid Barcodes | XXX |
Number of Bases | XXX |
Bases with Valid Barcodes | XXX |
Full Length Rate | XXX |
Mean Length | XXX |
N50 | XXX |
Mean Qscore | XXX |
注:
Number of Reads:reads总数;
Reads with Valid Barcodes:包含有效Barcode的reads数 ;
Number of Bases:碱基总数;
Bases with Valid Barcodes:包含有效Barcode的reads碱基数;
Full Length Rate:全长比例;
Mean Length:reads平均长度;
N50:reads的N50长度;
Mean Qscore:平均质量值。
reads长度与质量分布图,如下所示:
2 数据比对
比对结果统计如下表:
表2 比对结果统计
Type | Values |
---|---|
Reads Mapped to Genome | XXX |
Reads Mapped to Intergenic Regions | XXX |
Reads Mapped to Intronic Regions | XXX |
Reads Mapped to Exonic Regions | XXX |
Reads Mapped to Transcriptome | XXX |
注:
Reads Mapped to Genomes:比对到参考基因组上的Reads在总Reads中占的比例;
Reads Mapped to Intergenic Regions:比对到基因间区域的Reads在总Reads中占的比例;
Reads Mapped to Intronic Regions:比对到内含子区域的Reads在总Reads中占的比例;
Reads Mapped to Exonic Regions:比对到外显子区域的Reads在总Reads中占的比例;
Reads Mapped to Transcriptome:比对到已知参考转录本的Reads在总Reads中占的比例。
3 图像处理
每个玻片上都有Spots,实验时被组织切片覆盖,但是切片只会覆盖到部分Spots,实验时也只会获得覆盖区域下Spots中的基因表达。
图1 组织切片HE染色图
4 Spots统计
空间转录组的基因表达定量,主要基于UMI计数来实现的。通过UMI可以区分一条read是属于生物学重复还是技术重复,能够有效地去除PCR效应。对每个Barcode下的基因去除重复的UMI,统计unique UMI数目即表示细胞基因的表达量。分析统计如下:
表3 Spots统计
Type | Values |
---|---|
Sequencing Saturation | XXX |
Percent of Spots Under Tissue | XXX |
注:
Sequencing Saturation:测序饱和度;
Percent of Spots Under Tissue:切片组织下Spots的比例。
表4 不同水平Spots统计
Level | XXX |
Number of SupSpots | XXX |
Median UMI Counts per SupSpot | XXX |
Median Genes per SupSpot | XXX |
Total Genes Detected | XXX |
注:
Level:分辨率水平;
Number of SupSpots:一个或多个spot合并成的supspot个数;
Median UMI Counts per SupSpot:每个SupSpot的UMI中位数;
Median Genes per SupSpot:每个SupSpot中基因数目的中位数;
Total Genes Detected:基因总数。
图2 组织UMI count统计图
Spatial Barcode与转录本信息对应表如下所示。
表5 Barcode与转录本信息对应表
Barcode | Gene | UMI数 | UMI序列 | reads数 | reads id |
---|---|---|---|---|---|
Barcode-Gene-Line1 | |||||
Barcode-Gene-Line2 | |||||
Barcode-Gene-Line3 | |||||
Barcode-Gene-Line4 | |||||
Barcode-Gene-Line5 |
5 分辨率水平说明
百创S1000芯片可实现多级分辨率分析。通过调整supspot level参数,选取不同大小的spot点数作为分析单元,可以实现不同分辨率的数据分析和数据挖掘,最高分辨率supspot level 1可达到5μm亚细胞水平。
表6 supspot level分辨率表
SupSpot Level | 分辨率 | Spot点数 |
---|---|---|
13 | 100μm | 469 |
7 | 50μm | 127 |
6 | 42μm | 91 |
5 | 35μm | 61 |
4 | 27μm | 37 |
3 | 20μm | 19 |
2 | 10μm | 7 |
1 | 5μm | 1 |
图3 supspot level与spot点数图