来源:100医药网原创 2023-09-29 11:47
基因组测序揭示了人类群体中广泛的基因变异。错义变异是改变蛋白氨基酸序列的基因变异。致病性错义变异(pathogenic missense variant)会破坏蛋白功能,降低生物的适应能力,而良性错义基因组测序揭示了人类群体中广泛的基因变异。错义变异是改变蛋白氨基酸序列的基因变异。致病性错义变异(pathogenic missense variant)会破坏蛋白功能,降低生物的适应能力,而良性错义变异(benign missense variant)的影响有限。
对这些基因变异进行分类是人类遗传学一直面临的重要挑战。在已观察到的 400 多万个错义变异中,估计只有 2% 在临床上被归类为致病性错义变异或良性错义变异,而绝大多数错义变异的临床意义不明。这限制了对的,也限制了针对潜在遗传病因的临床治疗方法的开发或应用。机器学习方法可能能够利用生物数据中的模式来预测未注释基因变异的致病性,从而弥补基因变异解释方面的差距。具体来说,可以从蛋白序列中准确预测蛋白结构的AlphaFold可能可以作为预测蛋白变异致病性的基础。

在一项新的研究中,来自Google DeepMind公司的研究人员开发了AlphaMissense 来利用了多方面的进展:(i) 无监督蛋白语言建模以了解以序列上下文为条件的氨基酸分布;(ii) 通过使用 AlphaFold 衍生系统纳入结构上下文;(iii) 对来自群体频率数据的弱标签进行微调,从而避免人为注释的偏差。AlphaMissense 在临床注释、从头疾病变异和实验检测基准中实现了最先进的错义致病性预测,而无需在此类数据上进行明确的训练。作为科学界中的 一种资源,他们提供了人类蛋白质组中所有可能的单氨基酸替换预测数据库。他们在ClinVar数据集上使用精确度为90%的截止值,将32%的错义变异分类为可能致病的,57%的错义变异分类为可能良性的,从而为大多数人类错义变异提供了可靠的预测。相关研究结果发表在2023年9月22日的Science期刊上,论文标题为 Accurate proteome-wide missense variant effect prediction with AlphaMissense 。
这些作者展示了如何利用这一资源加速多个领域的研究。分子生物学家可能能够利用该数据库作为起点,设计和解释探测整个人类蛋白质组中饱和氨基酸替换的实验。人类遗传学家可能能够将基因水平上的 AlphaMissense 预测与基于群体队列的方法结合起来,定量确定基因的功能意义,尤其是对于较短的人类基因,因为在较短的人类基因中,基于群体队列的方法缺乏能力。最后,临床医生在对罕见病诊断中的从头变异进行优先排序时,可能能够从有把握分类的致病变异覆盖范围的扩大中获益,而且AlphaMissense 预测可能能够为使用了罕见的、可能是有害变异的注释的复杂性状遗传学研究提供信息。

AlphaMissense致病性预测。图片来自Science, 2023, doi:10.1126/science.adg7492。
综上所述,AlphaMissense 预测可能阐明错义变异对蛋白功能的分子影响,有助于识别致病性错义变异和以前未知的致病基因,并提高罕见遗传病的诊断率。AlphaMissense 还将促进从结构预测模型中进一步开发专门的蛋白变异效应预测工具。( 100yiyao.com)
参考资料:
Jun Cheng et al. . Science, 2023, doi:10.1126/science.adg7492.
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->