设为首页收藏本站

弧论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 896|回复: 0
打印 上一主题 下一主题

朝生物学的一个悠久目标迈进

[复制链接]

5905

主题

6600

帖子

7160

积分

坛主

Rank: 10Rank: 10Rank: 10

积分
7160
跳转到指定楼层
楼主
发表于 2022-3-30 23:03 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
朝生物学的一个悠久目标迈进[color=rgba(0, 0, 0, 0.3)]

[color=rgba(0, 0, 0, 0.3)]Original [color=rgba(0, 0, 0, 0.3)]Måka
原理 [color=rgba(0, 0, 0, 0.3)]2022-03-30 05:31
[color=rgba(0, 0, 0, 0.3)]


                               
登录/注册后可看大图



                               
登录/注册后可看大图

DNA是指导生命运转的“说明书”。虽然每一个人类细胞中都包含了大量基因,但这些所谓的编码DNA序列,也就是那些真正可以直接翻译构建出蛋白质的序列,其实只占到我们整个基因组的1%。剩下的99%是由非编码DNA组成的,这些非编码的基因并不携带构建蛋白质的指令。

但是,这些非编码的区域并不是真的毫无用处,它们以不同的方式指导着生命机器的运转,所以它们有时也被称为调节DNA。

比如,非编码DNA的其中一种重要功能就是帮助开启和关闭基因,这些被称为启动子的基因片段控制着制造出的蛋白质的数量,或者是否制造它们。


                               
登录/注册后可看大图
启动子。| 图片来源:NIH

更有意思的是,随着时间的推移,当细胞复制DNA并进行生长和分裂时,这些非编码区域经常会出现突变。很多突变微不足道,几乎不会带来什么影响,还有一些突变有时会微妙地改变它们控制基因表达的方式。有些突变可能是有益的,但它们偶尔也与一些疾病风险相关,比如2型糖尿病和癌症。

为了更深入地认识这类突变的影响,研究人员一直在努力研究数学图谱,让他们能观察生物的基因组,预测哪些基因会被表达,并确定这种表达将如何影响生物可见的特征。

这些图谱也被称为适应度景观。这一概念在大约一个世纪前被提出。早期的适应度景观非常简单,通常集中在有限的突变上。现如今,有了更丰富的数据集,但研究人员仍然需要额外的工具来描述这些复杂的数据,并将它们可视化。这不仅有助于更好地了解单个基因是如何随时间演变的,还能帮助预测未来可能发生的序列和表达变化

近日发表在《自然》上的一项新研究中,一组研究团队开发了一个用于研究调节DNA的适应度景观的框架。他们创建了一个神经网络模型,当经过数以亿计的实验测量的训练后,它能预测酵母中非编码序列的变化如何影响基因表达。根据DNA序列预测基因表达一直是生物学的重要目标之一,这项研究帮助我们朝着这个方向又迈进了一步。


  预测基因调节的进化  

在这项新研究中,团队的目标是创建一个无偏模型,能够根据任何可能的DNA序列预测生物的适应度和基因表达,甚至是那些前所未见的序列

他们选择创建了一个神经网络模型,通过一个数据集对这个模型进行了训练,将数百万个完全随机的非编码DNA序列插入酵母,并观察每个随机序列如何影响基因表达。其中重点关注和研究的对象就是包含启动子的子集。

对科学家来说,创建出一个精确的模型固然重要,但更准确地说,这仅仅一个起点。他们在研究中以各种方式测试了这个模型的预测能力,表明它能如何帮助解开某些启动子的进化历史,以及它们可能的未来

首先,为了确定模型是否可以帮助合成生物学的应用,比如生产抗生素、酶和食品,研究人员尝试用模型来设计启动子,控制各种基因达到理想的表达水平。然后,他们浏览了大量科学论文,确定了一些基本的进化问题,随后测试模型是否能帮助回答这些问题。

团队甚至还向他们的模型提供了一个真实世界群体数据集,其中包含了来自世界各地酵母菌株的遗传信息。通过这种方式,他们勾勒出过去几千年针对酵母的选择压力,正是这些压力塑造了现在的酵母基因组。

但这还不够。为了创建一种可以探测任何基因组的真正强大的工具,研究人员还要找到一种方法,即使在缺乏这样全面的群体数据集的情况下,也能预测非编码序列的进化

为了实现这一目标,团队设计了一种计算技术,将框架的预测结果绘制在一个二维图中。这用一种非常简单直观的方式,展示了任何非编码DNA序列将如何影响基因表达和适应度,而并不需要在实验室工作台上进行任何耗时的实验。

这项研究说明,人工智能不仅可以预测调节DNA变化的影响,还可以揭示支配数百万年进化的基本原则


  预测基因的“神谕”  

研究资深作者Aviv Regev表示,这就好比拥有了一个“神谕”:“我们现在可以问它,如果我们尝试这个序列所有可能的突变会怎样?或者,我们应该设计什么样的新序列来满足所需要的基因表达?科学家能将这个模型用于他们研究的进化问题或情景,并解决其他问题,比如创造出以理想方式控制基因表达的序列。”

团队相信,即使在短期内,一些应用场景已经非常清晰,比如为酿酒、烘焙和生物技术中的酵母定制调节DNA。而长远来看,这项研究的延伸也有望帮助识别人类调节DNA中的疾病突变,这些突变目前很难找到,并且在临床上基本被忽视了。

甚至在研究正式发表之前,团队已经开始收到其他研究人员的询问,他们希望使用这个模型设计出用于基因治疗的非编码DNA序列。

这项研究展示了一种光明的前景,可以在更丰富、更复杂和更多样化的数据集上训练出基因调节的人工智能模型。它们也有望帮助回答更多有关基础生物学和基因进化有关的尚未解决的大问题。

#创作团队:
编译:Måka
排版:雯雯
#参考来源:
https://news.mit.edu/2022/oracle-predicting-evolution-gene-regulation-0311
https://www.nature.com/articles/d41586-022-00384-0
https://www.nature.com/articles/s41586-022-04506-6
#图片来源:
封面图:Martin Krzywinski
首图:Martin Krzywinski


大道至简 万物于弧
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|Archiver|小黑屋|国际弧学研究会    

GMT-7, 2024-4-28 10:36 , Processed in 0.469242 second(s), 22 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表