人类遗传学:基于机器学习的人类基因重组图谱构建进展

  • 2022-01-26 00:00
  • 来源:医药资讯网
  • 阅读:398

资料来源:营养与健康研究所,2022年1月26日08:41

中国科学院上海营养与健康研究所李海鹏课题组等。在《人类遗传学》在线发表了题为《基于Uk10k数据集的精细人类遗传图谱》的研究论文。基因重组是生命进化的基础。在有性生物的配子形成过程中,来自亲本的染色体相互交换遗传物质,从而增加了相邻基因间不同等位基因的组合,丰富了不同基因的遗传多样性。

中国科学院上海营养与健康研究所李海鹏课题组等。在《人类遗传学》在线发表了题为《基于Uk10k数据集的精细人类遗传图谱》的研究论文。基因重组是生命进化的基础。在有性生物的配子形成过程中,来自亲本的染色体相互交换遗传物质,从而增加了相邻基因间不同等位基因的组合,丰富了遗传多样性。定量基因组不同区域的遗传重组率是生物学研究的重点。精确的遗传重组图谱对于探索重组机制、杂交育种、准确定位致病突变和某一性状的决定基因都非常重要。

遗传重组率估计的准确性与数据中包含的遗传重组事件的数量成正比。如果数据包括更多的遗传重组事件,遗传重组率估计就越准确,反之亦然。无论是基于家族或单精子测序还是群体遗传数据,这一原则都适用。基于群体遗传数据的分析局限于现有的分析方法,难以分析大样本。在这项研究中,研究人员扩展了早期开发的机器学习方法,并使用新开发的FastEPRR 2.0分析了UK10K的3781个无关个体(n=7,562个基因组)的测序数据。基于非洲以外人口的历史模型,他们精确估计了遗传重组率,并构建了精确的遗传重组图。总体而言,UKK遗传图谱中仍存在少数已知的遗传重组热点,但在UKK遗传图谱中,遗传重组率的估计波动相对平缓,遗传重组的异质性较低(见图)。为了分析样本量对估计的影响,从UK10K数据中随机抽取了2000400和200个基因组测序数据。分析结果表明,随着样本量的减少,遗传重组率的估计波动增大。结论上述结论不依赖于分析中使用的人口历史模型,研究者在使用恒定人口数模型时也观察到了同样的现象。这项研究提供了人类基因重组的精确图谱,并发现重组在基因组上的分布比预期的更均匀。

与机器学习中的黑盒概念相反,理论群体遗传学领域有着坚实的数学基础。2008年初,研究者预见到监督机器学习对群体遗传学的促进作用,于是在2011年首次将监督机器学习引入遗传学,并在2013年(Genetics)和2016年(G3)继续发展这一新范式。在某些方面,尽管监督机器学习优于最大似然法和贝叶斯法,但这种新范式能否给进化生物学带来新的发现仍是未知的。结果表明,新范式带来了新的发现,并回应了该领域的一些质疑。(100yiyao.com)

版权声明

本网站标注“来源:百医网”或“来源:bioon”的文字、图片、音视频资料均属于百医网网站版权所有。未经授权,任何媒体、网站或个人不得转载,否则将承担责任。获得书面授权转载时,必须注明“来源:百医网”。其他来源的文章均为转载。本网站所有转载都是为了传递更多信息。转载不代表本网站的立场。不想被转载的媒体或个人可以联系我们,我们会立即删除。

87%的用户在随时阅读、评论、分享百医网APP。借口


八宝山殡葬服务