物理科技生物学-PHYICA

人工智能技术缩小范围,只提出可以在实验室生产的候选分子

技术工程 2022-06-05 21:53:30

Artificial intelligence technique only proposes candidate molecules that can actually be produced in a lab麻省理工学院的研究人员开发了一种机器学习模型,它可以为药物发现过程提出新的分子,同时确保它建议的分子实际上可以在实验室中合成。鸣谢:麻省理工新闻制药公司正在使用人工智能来简化发现新药的过程。机器学习模型可以提出具有特定属性的新分子,这些分子可以对抗某些疾病,在几分钟内完成人类可能需要几个月才能完成的工作。但是有一个主要的障碍阻碍了这些系统的发展:这些模型经常提出新的分子结构,这些结构很难或者不可能在实验室中产生。如果一个化学家不能真正制造出这种分子,它的抗病特性就无法测试。

麻省理工学院研究人员的一种新方法限制了机器学习模型,因此它只能提出可以合成的分子结构。该方法保证了分子是由可购买的材料组成的,并且这些材料之间发生的化学反应遵循化学定律。

与其他方法相比,他们的模型提出的分子结构在流行的评估中得分很高,有时甚至更好,但保证是可合成的。他们的系统还需要不到一秒钟来提出合成途径,而其他方法分别提出分子,然后评估它们的可合成性,可能需要几分钟。在一个可以包含数十亿潜在分子的搜索空间中,节省的时间越来越多。

“这个过程改变了我们要求这些模型生成新分子结构的方式。这些模型中的许多都在考虑一个原子接一个原子或一个键接一个键地构建新的分子结构。相反,我们正在一个积木一个积木地、一个反应一个反应地建造新的分子,”Connor Coley说,他是麻省理工学院化学工程、电气工程和计算机科学系的Henri Slezynger职业发展助理教授,也是这篇论文的高级作者。

与科里一起发表论文的还有第一作者文浩·高(音译),一名研究生,和罗奇奥·梅尔卡多(Rocío Mercado),一名博士后。这项研究在本周的国际学习表现会议上发表。

积木

为了创建分子结构,该模型模拟了合成分子的过程,以确保它可以被生产出来。

该模型被给予一组可行的构建块,即可以购买的化学物质,以及有效化学反应的列表。这些化学反应模板都是专家手工制作的。通过只允许某些化学物质或特定反应来控制这些输入,使研究人员能够限制新分子的搜索空间。

该模型使用这些输入来构建一棵树,通过选择构建模块并通过化学反应将它们连接起来,一次一个,以构建最终的分子。在每一步,随着额外的化学物质和反应的加入,分子变得更加复杂。

它既输出最终的分子结构,也输出合成它的化学物质和反应树。

“我们不是直接设计产品分子本身,而是设计一个动作序列来获得那个分子。这使我们能够保证结构的质量,”高说。

为了训练他们的模型,研究人员输入一个完整的分子结构和一组构建模块和化学反应,模型学习创建一棵合成分子的树。在看到成千上万的例子后,模型学会了自己想出这些合成途径。

分子优化

经过训练的模型可用于优化。研究人员定义了他们希望在最终分子中实现的某些属性,给定了某些构建模块和化学反应模板,该模型提出了一种可合成的分子结构。

“令人惊讶的是,用这么小的模板集就能复制出这么大一部分分子。梅尔卡多说:“你不需要那么多积木来生成大量可供模型搜索的化学空间。

他们通过评估该模型重建可合成分子的能力来测试该模型。它能够复制这些分子的51 %,并且用了不到一秒的时间来重现每一个分子。

他们的技术比其他一些方法更快,因为模型没有为树中的每一步搜索所有选项。高解释说,它有一套确定的化学物质和反应。

当他们使用他们的模型提出具有特定属性的分子时,他们的方法提出了比其他方法更高质量的分子结构,具有更强的结合亲和力。这意味着分子s能够更好地附着在蛋白质上,阻止某种活动,比如阻止病毒复制。

例如,当提出一种可以与SARS-Cov-2对接的分子时,他们的模型提出了几种可能比现有抑制剂更能与病毒蛋白结合的分子结构。然而,正如作者所承认的,这些只是计算预测。

“有太多的疾病需要解决,”高说。“我希望我们的方法可以加速这一过程,这样我们就不必每次都从数十亿个分子中筛选疾病靶点。相反,我们可以只指定我们想要的属性,这可以加快寻找候选药物的过程。”

他们的模型也可以改善现有的药物研发渠道。梅尔卡多说,如果一家公司已经确定了一种具有所需特性但无法生产的特定分子,他们可以利用这种模型提出与之非常相似的可合成分子。

现在他们已经验证了他们的方法,该团队计划继续改进化学反应模板,以进一步提高模型的性能。有了额外的模板,他们可以对某些疾病目标进行更多的测试,并最终将该模型应用于药物发现过程。

“理想情况下,我们需要自动设计分子并同时快速给出合成树的算法,”Marwin Segler说,他领导着一个在微软剑桥研究院(英国)从事药物发现机器学习的团队,但没有参与这项工作。“Coley教授和他的团队的这种优雅的方法是解决这一问题的重要一步。虽然有早期的通过合成树生成进行分子设计的概念验证工作,但这个团队确实做到了。他们第一次在有意义的规模上展示了优异的性能,因此它可以在计算机辅助分子发现中产生实际影响。

这项工作也非常令人兴奋,因为它可能最终实现计算机辅助综合规划的新范式。这可能会对该领域未来的研究产生巨大的启发。"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/17687.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~