本文由东方肝胆外科医院信号转导国际合作实验室的Lei Chen, Hongyang Wang, 以及清华大学的Jin Gu老师共同合作,于2021年发表在SCIENCE ADVANCE。
整体实验设计
样本:
7例早期肝癌病人的21个组织标本,可分成N, nontumor section; L, leading-edge section; T, tumor section,P,portal vein tumor thrombus section
测序(对所有section):
1,10x Genomics Visium platform 空间转录组测序
2,全外显子测序
公共数据:
2个HCC的bulk datasets(from TCGA and LCI)
他们自己的bulkRNA cohort(239 HCC cases)
结果:
主要细胞类型空间分布
用harmony对不同的数据进行integrate,可以看到在Tumor里面 nUMI和nGene的数量更多,符合预期。接着作者用一个signature-based strategy 计算不同细胞类型在ST数据中的打分,发现正常肝细胞的分数主要集中在N section,Malignancy主要富集在T/L/P, 免疫细胞和stromal细胞的没有明显的分布,可能是因为不同组织的免疫浸润程度不一。此外作者在补充数据(Figs. S2A and S3A)展示了空间转录组上celltype marker 富集的位置和H&E病理结果位置一致
慢性肝癌的空间表达谱模式
以病人分类,看了一下不同cluster的比例,发现cluster在不同的section有不同的分布,根据分级聚类以及diffusion map 分析,发现来源于同一region的cluster更倾向于聚类在一起。C图利用diffusion map 将所有spots整理到一个单维pseudo-order,并且发现stromal区域的fibroblasts,endothelial 等无固定组成模式。
边缘地区(Leading-edge area)微环境特征
在这部分研究中,由于有些section有明显的boundary(HCC-1T,HCC-3T),有些section没有明显的boundary(HCC-2T),作者引入了两个概念 spatial continuity degree 和transcriptome diversity degree 来计算不同section的spot 细胞标签连续性和表达量的离散程度。发现HCC-1, HCC-3, 和HCC-4的空间连续性高,表达离散程度低(Fig.3A)。
进一步研究HCC-1L,3L,4L的病理学特征,发现它们都有明显的纤维囊(fibrous capsules)。而cHC-1L和HCC-2L呈由间质细胞组成的不连续条带,ICC-1L在肿瘤结节边缘无包膜(capsules),并且在HCC-4L中发现从normal到tumor区域,跨过纤维囊后基质细胞和免疫细胞的marker表达量明显降低。说明纤维
囊可能会影响免疫细胞和基质细胞的分布。(Fig4A,B,C)
作者将拥有明显完整纤维囊的section定义为CC group,没有或不连续纤维囊的section归类为NC group,CC 中以纤维囊作为transition region,NC中以stromal cell 作为transition region将Tumor,Normal分开,比较了一下两个group中tumor,normal,transition area的细胞组成情况以及从normal-tumor pathway的活动变化(GSVA)。结果发现完整的纤维囊对细胞组成分布,已经空间细胞分布有明显的影响,但是对一些主要的pathway激活没有明显作用。(Fig4E,F,G,H)
早期肝癌的肿瘤异质性
对各个tumor cluster 通过GSVA 富集到的pathway进行聚类分析,可以将这些pathway分为两类,module1和细胞周期/代谢相关,module2和免疫,上皮-间充质转化相关。(Fig4A)
HCC-1T的tumor在两个module中都有富集,T.2 富集到module2,T.5和T.6在module1中富集,这3个cluster呈现出不同的表达分布模式,根据两个datasets的公共数据进行生存分析发现,和T.2相似的数据有更好的预后,并且和T.5相似的数据比和T.6相似的数据的预后更差。(Fig4B-C)
以四个spot的宽度(各个cluster 2个点),选取cluster boundary区域利用cellphonedb进行细胞通讯分析,不同cluster中的有特异富集的LR也有共享的LR。对空间转录组的数据进行CNV分析,和对应的WES的数据高度match,并且ST的数据能给出更多微小的CNV变化。CNV 模式和细胞通讯分析说明了肿瘤内部不同cluster之间有多种不同的调控通路以及不同的起源。(Fig4D-F)
肿瘤干细胞的功能
肿瘤干细胞(cancer stem cell,CSC)在肿瘤的异质性中发挥重要作用,作者利用5个常用的肝癌干性marker(CD47, EPCAM, KRT19, PROM1, SOX9)的表达作为指标,每个病人的tumor spots中,高表达其中某个stem-related marker的top5% spots作为CSC niches
比较CSC niches 在不同section的比例,发现在HCC-2中,CD47-, SOX9-, and PROM1- 高表达的CSC niches 比例在L-T-P中逐渐上升,这些niches在tumor中散漫分布,无聚集,PROM1- 高表达的CSC niches 有更多的double-positive(Fig5A-C)
作者将pathway和celltype在HCC-2的5个niches中做了富集,发现EMT, hypoxia, tumor necrosis factor–a, apoptosis pathways,CD4+ Tem cells 和 cDCs 在PROM1+ 和CD47+ CSC niches中有富集,并且利用bulkRNA的结果进行相关性分析,得到同样的结果。(Fig5D-G)
PROM1+CSC niches可能通过增强肿瘤细胞中的某些信号和重塑肿瘤细胞周围的TME在肿瘤进展中发挥关键作用。
全局探究HCC内的异质性
将一例HCC分成4个section进行空间转录组测序,4个section的spots integrate到一起进行非监督聚类分析得到6个cluster。不同的section中,不同cluster spots所占的比例不同(Fig6A-D)
将HCC的整个平面,分成16份(sector),每个section平均分为4份,并且从4个section的中心位置,按照5 spots的宽度,划分g1-g18的18个环。可以看到cluster1,cluster2,cluster5占据了好几个section的区域(Fig6E)。
做pathway活性中位数和离肿瘤中心位置的距离的相关性分析(spearman)可以看到,即使是同一个cluster,在不同的sectors和不同的环中,激活的信号通路也不一样。将信号通路的富集活性映射到整个平面中,可以看到B-2.1中大部分通路的活性呈梯度下降,D-3.1和D-4.1中呈梯度上升。氧化磷酸化信号水平在D-3.1、D-4.1、B-4.2、D-1.2中呈持续梯度上升(Fig6F-H)
这个分析说明了即使是在非常早期的肿瘤中,也有明显的异质性。
TLS的空间分布及临床意义
HCC-5 高表达TLS形成相关的基因,通过病理染色鉴定cluster6为TLS区域,将cluster6差异表达的top50 marker gene(TLS-50)作为TLS的鉴别marker. 发现TLS主要存在于L section的非tumor区域,并且伴随T/B/DC细胞的富集(Fig7A-C)
根据TLS区域的细胞组成和与tumor区域距离的相关性分析,可以看到CD8+ Tcm细胞(cHC-1、HCC-3)、CD8+ Tem细胞(cHC-1、HCC-1、HCC-4、ICC-1)、CD4+ T细胞(cHC-1、ICC-1)与肿瘤距离呈负相关,一些gene的表达和TLS到tumor的距离相关,说明TLS的细胞组成以及功能可能受肿瘤影像(Fig7D)。
将距离TLS 5个spots内的区域定义为TLS的surrounding区域,图示基因表达量随surrounding的距离逐步下降。提示他们可能和TLS的形成相关(FIg7E)。
最后在bulk的HCC数据中,发现TLS-50 打分在tumor size大于3 cm的肿瘤或者处于B/C stage的肿瘤中比较低(Fig7F)。高TLS-50分数与更好的预后相关(Fig7G)
文章思路总结:
本文是一篇比较完整全面的主要对空间转录数据进行分析利用的文章,WES的数据作为空转CNV分析的佐证,bulk数据用于结合一些临床生存分析,或者一些表达量的比较分析。全文没有用到单细胞转录组数据,没有明确的celltype注释,根据marker gene打分对不同区域celltype富集进行判断。
分析方法总结
seurat+stcancer 做空间转录组的的normalization+reduction+cluster
harmony : 数据整合
signature-based strategy: First, we curated a set of gene signatures of common cell types in liver cancer based on the xCell signatures (25) and biology prior knowledge (table S3). Then, we defined the average log-transformed normalization expression values of the genes in the signature as the corresponding cell type scores.
destiny R package:diffusion map
infercnv R package: CNV分析
cellphonedb:interaction 分析
GAVA R package:GAVA 分析