Nat Biotechnol

  • 2024-06-13 00:00
  • 来源:医药资讯网
  • 阅读:474

近年来,利用高通量测序技术来分析肿瘤的克隆结构和进化历史成为癌症研究的热点。通过重建肿瘤亚克隆(subclonal reconstruction),研究人员可以更好地理解肿瘤如何起源、发展以及对选择性压力(selective pressures)的反应。

ICGC TCGA(国际癌症基因组联合会-癌症基因组图谱)DREAM体细胞突变检测肿瘤异质性与进化挑战(Somatic Mutation Calling Tumor Heterogeneity and Evolution Challenge)正是在这一背景下发起的,旨在评估现有的亚克隆重建算法。这项为期七年的合作使用云计算对31种亚克隆重建算法在51个模拟肿瘤中的表现进行了基准测试。

肿瘤的演化是一个从正常细胞逐步积累体细胞突变(somatic mutations)的过程。这些突变的产生受细胞染色质结构以及内源性和外源性诱变压力的影响。如果特定突变赋予细胞选择性优势,那么这些细胞的后代就可能在其局部环境中扩展。这一过程可能会持续多年甚至数十年,直到由一个共同祖先衍生出具有多个癌症特征的细胞群体(克隆,clone)。在这个过程中,不同的亚群(亚克隆,subclones)可能会因漂变或选择性压力而出现。

亚克隆重建的目的是通过分析肿瘤DNA测序数据中的突变特征来推断肿瘤亚克隆的定量特征。为了实现这一目标,研究人员开发了许多基于体细胞单核苷酸变异(SNVs)和拷贝数异常(CNAs)的算法。这些算法广泛应用贝叶斯推断(Bayesian inference)等方法来识别和量化肿瘤亚克隆的组成和演化。

在该基准测试中,研究人员评估了每种算法在七个独立任务中的表现,累计进行了12,061次运行。结果表明,算法的选择对性能的影响远大于肿瘤特征,而调整纯度的读取深度、拷贝数状态和读取可映射性(read mappability)与大多数任务中大多数算法的性能有关。

该研究强调了现有亚克隆重建方法在准确性方面的差异,并指出了进一步研究和改进的需求。通过提供所有容器化方法、评估代码和数据集,研究人员希望支持未来对亚克隆重建准确性的决定因素的进一步评估,并开发更好的方法来理解肿瘤的演化。

通过对这些算法进行基准测试,研究人员不仅能够确定哪些算法在特定任务中表现最佳,还能揭示影响重建准确性的主要因素。这将有助于优化实验设计(如测序深度)和算法选择,从而提高单样本肿瘤亚克隆重建的准确性和可靠性。(6月11日Nature Biotechnology在 Crowd-sourced benchmarking of single-sample tumor subclonal reconstruction )


八宝山殡葬服务