科学家打造空间转录组分析新工具,无需使用单细胞数据作为参考,能整合不同患者的空间数据

科学家打造空间转录组分析新工具,无需使用单细胞数据作为参考,能整合不同患者的空间数据
2024年03月27日 16:41 DeepTech深科技

来源:DeepTech深科技

近日,来自美国哥伦比亚大学、美国斯隆—凯特林癌症研究所的研究人员,开发出一款空间转录组分析新工具 Starfysh,它能在跨病人样本的前提之下,分析组织中基因表达的空间异质性。

作为一款空间转录组分析工具,Starfysh 已经被课题组进行开源。同时,该团队也提供了代码调用教程(https://github.com/azizilab/starfysh)。

(来源:Nature Biotechnology)(来源:Nature Biotechnology

Starfysh 解决了目前部分测序技术存在的低空间分辨率的缺陷。该方法可以将不同组织的空间转录组数据、以及对应的组织学图片加以结合,通过空间基因表达与组织学特征,针对不同位点的细胞类型与细胞状态比例进行预测。

与其他空间转录组方法相比,Starfysh 无需使用单细胞数据作为参考,因此在分析上存在较好的灵活性,对于分析罕见、且难以匹配单细胞测序的数据提供了新方法。

对于大批量病人的数据,Starfysh 具有较强的融合能力,故能进行大批量的比较分析,从而能够提供一种全面且深入的分析方式。

作为一种新型计算工具包,Starfysh 使用基于变分推断的方法,将组织学图像与空间转录组数据集成,进而开展去卷积的操作。

由于不需要来自于单细胞 RNA-seq 的参考数据,因此这是一个重要的进步。

因为,在组织学图像之中,包含有关空间依赖性结构的信息,这些信息可以指导数据的反卷积,相比针对非信息性空间的相关误差项进行建模的方式,本次方法更加准确。

对于此前的大多数空间技术来说,它们缺乏真正的单细胞分辨率。而在机器学习框架的帮助之下,可以将组织学与空间转录组学加以结合,从而能够从空间转录组学之中,获得更加精细的发现。

(来源:Nature Biotechnology)(来源:Nature Biotechnology

同时,Starfysh 能够整合不同研究和不同患者群体的空间数据,从而可以利用更多的患者样本,来更好地发现罕见的肿瘤微环境、或者识别不同肿瘤类型的耐药性机理。

目前,已经有不少用户与合作者正在使用 Starfysh。甚至已有学者在它的帮助之下,开展了一项针对黑色素瘤小型冷冻临床标本的研究,相关论文已经发表在 Nature Genetics

Starfysh 的应用不仅局限于不同类型的肿瘤样本,对于发育生物学或药物研发相关的样本,也能带来广泛的应用。论文中,课题组也列举了一些公共数据在老鼠大脑皮层的应用效果。

同时,在研究中该团队重点研究了化生型乳腺癌。他们在 Starfysh 的帮助之下发现了特殊空间性质,对于发展化生型乳腺癌的新型治疗方法能够带来一定的指导作用。

与此同时,一些外部合作者也在积极探索相应的免疫细胞疗法,以期寻找治疗这种罕见型乳腺癌的有效方式。总的来说,Starfysh 将能在生物医学数据分析领域带来广泛作用。

(来源:Nature Biotechnology)(来源:Nature Biotechnology

空间基因表达分析法亟待“破局”

据了解,在人体体内的不同位置中,细胞的类型和表现存在一定的差异。细胞的空间位置、以及细胞之间的相互作用,能对生命活动起着决定性作用,比如能够决定组织的发育、决定对于药物的反应、以及决定肿瘤的发生与预后。

此前,已有的针对空间基因表达的分析方法存在一定的局限性。例如:空间转录组测序技术,往往只能测量有限的基因数量;全基因组空间转录组测序技术,其空间分辨率相对较低。

同时,全基因组空间转录组的测序技术,往往无法针对单个细胞类型进行评估,比如无法区分出某位点(spots)的不同免疫细胞与周围组织的相互作用。

而且,它也无法知道不同细胞类型在空间中的分布,因此只能在低空间分辨率的基因表达层面上进行笼统的分析。

对于理解与剖析复杂的生物系统例如剖析肿瘤微环境来说,上述局限性带来了一定阻碍。

例如,乳腺癌存在不同的亚型分类,对于不同亚型进行微环境表征时,需要对细胞类型在组织空间上进行描述与比较,以及剖析对于疗法存在不同反应的原因,比如剖析免疫细胞在亚型中的行为差异等。

五角形带来命名灵感

而之所以开发 Starfysh,正是因为研究人员发现已有的空间数据分析方法都依赖于单细胞数据。于是,他们希望开发一款不需要单细胞的方法。

研究伊始,他们先是研发了一种半监督学习算法,试图使用 bottleneck 来区分细胞类型。但是,该算法的鲁棒性和可解释性都比较差。

于是,课题组决定加入细胞标记物等细胞特征、以及加入 Archetypes 作为先验知识。另一方面,由于 visium 数据能够匹配相应的组织学图像,所以他们开始思考如何利用这一部分的空间信息。

在多次尝试不同模型之后,他们采用 product of experts 的方法,来将图像与空间数据加以融合。同时,使用辅助深度生成模型的方法,来对图像与空间组学进行建模。

此外,课题组还使用 Archetypes 分析的方法来获得先验分布,从而避开对于单细胞数据的依赖。

后来,他们又对模型加以调整,不再使用辅助深度生成模型,转而对数据生成过程进行略微修改,以便能对细胞类型实现更好的可解释性。

在开发工具包的时候,由于要在不同数据集上进行验证,于是他们设计了合成数据,也调用了公开数据集。

此外,课题组非常关注化生型乳腺癌样本,因此需要设计简单易懂的教程,以方便其他研究者使用。

这就要求他们不仅要具备算法开发能力,还需要掌握不同类型数据所涉及的生物医学背景知识。值得庆幸的是,该团队的成员恰好拥有不同的背景,从而能给研究带来“交叉型助力”。

而在原理上,Starfysh 结合了 Archetypes 分析与图概率模型模拟基因表达的测序过程。

通过 Archetypes 分析可以找出最具特殊性的 spots,从而与已知细胞类型的 marker,共同判断组织中的预期细胞类型、或新的细胞类型,进而找到某位病人样本中存在的特殊细胞状态。

研究中,课题组使用 Starfysh 发现了肿瘤细胞与不同免疫细胞相互作用的空间特征。

这种差异不仅存在于乳腺癌的不同亚型中,并且可能是某些亚型比如化生型乳腺癌耐药性的原因,而基于此制定新型治疗方案,或许可以有效克服耐药性。

同时,该团队重点研究了化生型乳腺癌的肿瘤样本、与其他三阴性乳腺癌样本的差异。

结果发现:免疫抑制细胞比如调节性 T 细胞,在化生型乳腺癌中存在浸润现象,而这有助于癌细胞更好地适应缺氧的微环境。

研究人员还发现 Starfysh 也能用于其他相关的空间数据,比如用于表征和分析鼠的淋巴结组织、人脑皮质组织、以及前列腺癌等。

由此可见,对于分析复杂生物组织的空间特征与综合图谱来说,Starfysh 是一种有效的方法。

另据悉,课题组最初在三个细胞类型的合成数据集上来验证模型。但是,spots 的隐变量是连续的,因此在低维可视化时显示为一个三角形。

而在五个细胞类型之时,直接出现了类似海星的五角形状。虽然这张五角图片,并未被采用到论文的主图中。但是,他们以此为灵感,定下了 Starfysh 这个名字。

(来源:https://github.com/azizilab/starfysh)(来源:https://github.com/azizilab/starfysh)

图 | 相关论文(来源:Nature Biotechnology

博士生何锶瑜、金一诺和阿基里·拿撒勒(Achille Nazaret )是共同一作。美国斯隆—凯特林癌症研究所的亚历山大·Y·鲁登斯基(Alexander Y. Rudensky)教授和乔治·普利塔斯(George Plitas)教授、以及美国哥伦比亚大学埃勒姆·阿齐(Elham Azizi)教授担任共同通讯作者。

图 | 部分研究人员(来源:课题组)图 | 部分研究人员(来源:课题组)

研究人员最后表示:“当前,AI for healthcare 正在成为越来越热门的话题,在基因组学和其他生物医学领域上都有巨大的应用潜力。而本研究正是 AI 在生物医疗数据上应用的一个具体例子,相信未来将会有更多、更广的应用。”

参考资料:参考资料:

1.He, S., Jin, Y., Nazaret, A.et al. Starfysh integrates spatial transcriptomic and histologic data to reveal heterogeneous tumor–immune hubs. Nat Biotechnol (2024). https://doi.org/10.1038/s41587-024-02173-8

运营/排版:何晨龙

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片