人工智能检测自闭症背后的一类新突变,垃圾DNA中发现自闭症的新病因

澳门新葡京官方网址 2
人才发展

澳门新葡京官方网址 1

澳门新葡京官方网址 2

导致疾病的DNA中的许多突变不在实际基因中,而是位于曾被认为是垃圾的99%的基因组中。尽管科学家们最近已经明白,这些巨大的DNA片段确实发挥了关键作用,但迄今为止,大规模地破译这些影响是不可能的。

研究人员利用人工智能技术证明,所谓的垃圾DNA突变可导致自闭症。该研究于5月27日在Nature
Genetics上发表,是第一个将此类突变与神经发育状况联系起来的研究。

利用人工智能,普林斯顿大学领导的团队已经解释了这种突变对自闭症患者的功能影响。研究人员认为,这种强有力的方法通常适用于发现任何疾病的遗传贡献。

该研究由Olga Troyanskaya与Robert
Darnell合作领导。Troyanskaya是在基因组学副主任熨斗研究所的中心计算生物学在纽约市(CCB)和普林斯顿大学计算机科学系教授。Darnell是洛克菲勒大学的Robert和Harriet
Heilbrunn癌症生物学教授,也是Howard Hughes医学研究所的研究员。

研究人员于5月27日在Nature
Genetics期刊上发表文章,分析了1790个家庭的基因组,其中一个孩子患有孤独症谱系障碍,但其他成员则没有。该方法在120,000个突变中进行分类,以找到那些影响自闭症患者基因行为的突变。虽然结果没有揭示自闭症病例的确切原因,但它们揭示了研究人员研究的数千种可能的贡献者。

他们的团队使用机器学习来分析1,790名自闭症患者及其未受影响的父母和兄弟姐妹的全基因组。这些人没有自闭症的家族史,这意味着他们病情的遗传原因可能是自发突变而不是遗传突变。

以前的许多研究都集中在识别基因本身的突变上。基因本质上是制造构建和控制身体的许多蛋白质的说明。基因突变导致突变的蛋白质,其功能被破坏。然而,其他类型的突变会破坏基因的调控方式。这些区域的突变不会影响基因的产生,而是产生何时和产生多少。

该分析预测了基因组部分中不编码蛋白质的遗传突变的分枝,这些区域经常被误认为是垃圾DNA。与非编码突变相关的自闭症病例的数量与禁用基因功能的蛋白质编码突变相关的病例数相当。

研究人员说,到目前为止,不可能在整个基因组中查找调控基因的DNA片段,并预测这种调节DNA中的突变可能如何导致复杂疾病。该研究首次证明调节DNA突变可导致复杂疾病。

Troyanskaya说,这项工作的意义超越了自闭症。这是第一次明确证实非遗传性非编码突变导致任何复杂的人类疾病或病症。

这种方法为任何疾病的分析提供了一个框架,计算机科学和基因组学教授,该研究的高级作者Olga
Troyanskaya说。该方法可能特别有助于神经系统疾病,癌症,心脏病和许多其他无法确定遗传原因的努力。

研究报告的共同作者,CCB和普林斯顿的Jian
Zhou说,科学家可以应用新研究中使用的相同技术来探索非编码突变在癌症和心脏病等疾病中的作用。这使人们对不仅是自闭症,而且还有许多人类疾病的原因有了新的认识。

这改变了我们思考这些疾病可能原因所需的方式,Troyanskaya说,她也是纽约西蒙斯基金会熨斗研究所基因组学副主任,领导了一组合着者。

只有1%到2%的人类基因组由编码制造蛋白质蓝图的基因组成。这些蛋白质在我们的身体中执行任务,例如调节血糖水平,对抗感染和在细胞之间发送通信。然而,我们基因组的另外98%不是基因死重。非编码区有助于调节基因何时何地产生蛋白质。

该团队还包括由洛克菲勒大学的神经科学家Robert
Darnell领导的小组。本文的第一作者是Jian Zhou和Christopher
Park,他们在普林斯顿大学获得博士学位,现在正在访问Lewis-Sigler综合基因组学研究所的合作者和Flatiron研究所的研究人员,以及普林斯顿Lewis-Sigler研究所的Chandra
Theesfeld。用于整合基因组学。

在没有自闭症家族史的个体中,蛋白质编码区域的突变占自闭症病例的最多30%。证据表明,引起自闭症的突变也必须发生在基因组的其他地方。

大多数先前关于疾病遗传基础的研究都集中在20,000个已知基因和调节这些基因的DNA的周围部分。然而,即使是大量的遗传信息也只占人类基因组中32亿个化学对的1%多一点。其他99%传统上被认为是黑暗或垃圾,尽管最近的研究已经开始破坏这一想法。

揭示哪些非编码突变可能导致自闭症是棘手的。单个个体可能具有数十个非编码突变,其中大多数是个体独有的。这使得识别受影响人群中常见突变的传统方法无法实现。

在他们的新发现中,研究团队提供了一种方法来理解这一大量基因组数据。该系统使用称为深度学习的人工智能技术,其中算法执行连续的分析层以了解否则将无法辨别的模式。在这种情况下,该算法教导自己如何识别DNA的生物学相关部分并预测这些片段是否在已知影响基因调节的2,000多种蛋白质相互作用中发挥作用。该系统还预测破坏单对DNA单元是否会对这些蛋白质相互作用产生实质性影响。

Troyanskaya和她的同事采取了新的方法。他们训练机器学习模型来预测给定序列如何影响基因表达。

Troyanskaya说,该算法沿基因组滑动分析其周围1000个化学对的每一个化学对,直到它扫描了所有突变。因此,该系统可以预测突变整个基因组中每个化学单元的影响。最后,它揭示了可能调节可能干扰该调节的基因和突变的DNA序列的优先列表。

普林斯顿Troyanskaya实验室的研究科学家Chandra
Theesfeld说:这是对我们在分析中引入的基因研究思路的转变。除了研究大群个体共有基因突变的科学家之外,我们在这里应用了一套智能,复杂的工具,告诉我们任何特定的突变将会发生什么,甚至是那些罕见或以前从未观察到的突变。

在此计算成就之前,收集此类信息的传统方法是对每个序列进行艰苦的实验室实验以及该序列中的每个可能的突变。这些可能的功能和突变数量太大而无法考虑

澳门新葡京官方网址,实验方法需要针对超过2,000种类型的蛋白质相互作用测试每种突变,并在组织和细胞类型中反复重复这些实验,总计数亿次实验。其他研究小组试图通过将机器学习应用于DNA的靶向部分来加速这一发现,但是没有实现查看每个DNA单元和每个可能的突变的能力以及对整个基因组中超过2,000种调节相互作用的影响。

我们的论文真正允许你做的是采取所有这些可能性并对它们进行排名,帕克说。优先排序本身非常有用,因为现在你也可以继续在最优先的情况下进行实验。

最后,该系统基于已知的致病突变校准其并开发疾病影响评分,评估给定突变对疾病有何影响的可能性。

在自闭症的情况下,研究人员分析了1790个具有单纯性孤独症谱系障碍的家庭的基因组,这意味着该病症在一个孩子中是明显的,但在其他家庭成员中则不然。(这些数据来自2000多个孤独症家庭的Simons
Simplex
Collection。)在这个样本中,受自闭症谱系障碍影响的人中只有不到30%具有先前确定的遗传原因。研究人员表示,新发现的突变可能会显着增加这一比例。

预测每个突变的功能效应的能力是这项新研究的关键创新。之前的研究发现,与未受影响的人相比,检测自闭症患者的调节突变数量存在任何差异具有挑战性。然而,新方法研究了预测具有高功能影响的突变,发现受影响人群中此类突变的数量明显增多。

当研究人员随后查看哪些基因受这些突变影响时,他们发现它们是与大脑功能密切相关的基因。这些新发现的突变影响了与先前鉴定的突变相似的基因和功能。

现在我们打开这个领域,了解可能与自闭症有关的所有因素,Theesfeld说。

这些信息对于家庭及其医生来说也很重要,可以更好地诊断这种疾病,并避免过分笼统地假设一个人的孤独症如何与其他人分类。他们说,当你遇到一个患有自闭症的人时,你遇到了一个患有自闭症的人,因为没有相同的病例,Theesfeld说。基因上,它似乎是一样的。

通过这种新方法,该团队正在分析各种形式的癌症,心脏病和其他疾病的遗传原因。

研究人员通过将机器学习模型应用于称为Simons Simplex
Collection的遗传数据宝库来研究自闭症的遗传基础。该西蒙斯基金会,该熨斗研究所的上级组织,生产和维护的存储库。Simons
Simplex
Collection包含由自闭症儿童,未受影响的兄弟姐妹及其未受影响的父母组成的近2,000个四重奏的全基因组。

这些四人组既往没有自闭症的家族史,这意味着非遗传性突变可能是受影响儿童病情的原因。(这种突变在精子和卵细胞以及胚胎中自发发生。)

研究人员使用他们的模型预测每个自闭症儿童的非遗传性非编码突变的影响。然后,他们将这些预测与孩子未受影响的兄弟姐妹中相同的,未突变的链的影响进行了比较。

Simons Simplex
Collection的设计使我们能够进行这项研究,周说。未受影响的兄弟姐妹是一个内置的控制。

分析显示,许多自闭症儿童的非编码突变改变了基因调控。此外,结果表明突变影响了大脑中的基因表达和已经与自闭症相关的基因,例如那些负责神经元迁移和发育的基因。这与自闭症最有可能在大脑中的表现形成一致,该研究的共同作者,CCB研究科学家Christopher
Park说。这不仅仅是突变发生的数量,而是发生了什么样的突变。

研究人员在实验室实验中测试了一些非编码突变的影响。他们将自闭症儿童中发现的预测高影响突变插入到细胞中,并观察到基因表达的变化。这些变化肯定了模型的预测。

Troyanskaya说她和她的同事将继续改进和扩展他们的方法。最终,她希望这项工作能够改善遗传数据如何用于诊断和治疗疾病和疾病。现在,98%的基因组通常被扔掉,她说。我们的工作可以让你思考98%我们能做些什么。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图