计算机辅助合成计划与分子图编辑相结合,最大限度减少生物碱所需合成步数 - IT思维

IT思维  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

公众号/  ScienceAI(ID:Philosophyai)

编辑 | 绿萝

高效的化学合成对于满足未来对药物、材料和农用化学品的需求至关重要。预测复杂分子合成路线的软件的复杂性一直在迅速提高。尽管如此,算法在多大程度上复制或补充人类直觉仍然不确定。

在这里,美国密歇根大学药物化学系的研究人员探索了一种计算策略,将计算机辅助合成规划与分子图编辑相结合,以最大限度地减少生产生物碱所需的合成步骤数。

该研究最终通过利用具有高影响力的关键步骤实现了(–)-百部酰胺(Stemoamide)的对映选择性三步合成,通过设计一种基于图的补充方法来确定关键步骤的优先级,作者实现了该目标的最短合成。

该研究以「Computer-aided key step generation in alkaloid total synthesis」为题,于 2023 年 2 月 2 日发布在《Science》上。

计算机辅助合成计划与分子图编辑相结合,最大限度减少生物碱所需合成步数 - IT思维

论文链接:https://www.science.org/doi/10.1126/science.ade8459

高效的全合成能在尽可能少的步骤内将市售起始材料转化为复杂的目标分子。在实践中,这通常是通过优化关键步骤以同时形成许多必要的目标键来实现的,从而迅速产生结构复杂性。

常见示例包括环加成、级联或多组分偶联反应。尽管关键步骤的概念为全合成从业者所熟知,但它尚未在计算机辅助合成计划 (CASP) 中正式化。

现代 CASP 策略旨在最大限度地减少保护基团操作并最大限度地提高收敛性,但自动逆合成的重点一直放在编码反应规则上,以在预测路线的实验实现中实现最大可靠性,这有利于稳健的、有先例的反应。同时,最先进的人工合成策略通过瞄准创新但风险较高的关键步骤并最大限度地减少低影响的让步步骤,最大限度地提高步骤和原子经济。

在这里,研究人员探索使用 CASP 自动生成许多看似合理的关键步骤的协同作用,并手动选择高影响力的步骤,这些步骤被编码为图编辑距离的减少,以最大限度地减少总合成中的总步骤数。

用现代 CASP 设计的路线的实验证明已在药物合成中实现,但在生物碱全合成的复杂环境中使用相当少。研究选择从百部科植物中分离出来的茎酰胺(1)作为理想的目标分子,因为它的四个立体中心和稠合环结构将挑战现代 CASP,而它在三十二个历史和当代合成中的优先地位提供了一个强有力的比较基准。

计算机辅助合成计划与分子图编辑相结合,最大限度减少生物碱所需合成步数 - IT思维

图 1:使用计算机辅助关键步骤生成 1 的两个逆合成计划。(来源:论文)

计算机辅助逆合成计划

第一个逆合成计划去除 α-甲基并打断氮杂环的 C-N 键,得到环化烯烃 2,它本身是由 CASP 推荐的关键有机催化曼尼希-烯丙基化-内酯化序列产生的。高级中间体 2 进一步简化为起始材料 3、4 和两个当量的醛 5。通往 1 的第二条路线源于 CASP 和图编辑策略的演变。在这条路线中,CASP 推荐的 Schmidt-Aubé 重排是一个关键的简化元素。生成的环丁酮中间体 6 进一步分解为 7、8、9 和 10,利用关键的迈克尔加成和烷基化序列,这被确定为单独 CASP 搜索 1 的关键步骤。计算发现的路线编辑和实验实现如下所述。

揭示曼尼希反应是关键步骤

现代 CASP 平台偏爱条件明确的反应。因此,预测的路线通常具有较低的风险,但可能偏向于低影响的转换。一个识别合成理想性的系统可以与现代 CASP 平台的力量协同作用,即使可能需要额外的实验优化来实现风险更高、影响更大的关键步骤。

作为从 CASP 生成的路线中最小化步数的第一次尝试,(–)-1 在软件 SYNTHIA 中进行了自动逆合成,该软件具有提高化学选择性、区域选择性和立体选择性并降低保护基团使用的评分功能。

有机催化的曼尼希反应作为拟议的转化出现在每条预测路线中,这是一个意想不到的结果,因为这种众所周知的反应在 1 的 32 种先前合成中的任何一种中都没有出现。尽管如此,即使是最短的计算路线也有七步长。因此,为了简洁起见,研究人员选择通过最大化高影响转换和最小化低影响转换来逻辑地编辑计算出的路线。这需要一个新的系统来衡量台阶的影响。

计算机辅助合成计划与分子图编辑相结合,最大限度减少生物碱所需合成步数 - IT思维

图 2:通过图编辑分析识别关键步骤。(来源:论文)

在分子图编辑距离(Graph Edit Distance)图中,高影响反应步骤在通往最终目标的途中给定中间体之间应该有一个陡峭的斜率。

研究人员将每个中间体的分子图(包括起始材料和最终目标)编码为单独的邻接矩阵,其中行数和列数等于整个合成路线中使用的重原子和基团的总数。通过这种方式,最终目标的所有键及其从起始材料的进展,以及合成中使用的任何让步基团,都被准确地映射到每个单独的矩阵中,并与最终目标的矩阵相关。对矩阵 1 的简单比较表明,与计算的倒数第二个中间体 14 相比,它与起始材料 3 的矩阵共享更多条目 (99%) 、11、12、8 和 HBr (93%)。

因此,关键步骤最大限度地减少了从给定中间体到目标的图编辑距离,这相当于最大限度地形成目标键,同时最大限度地减少对让步组的反应操作。这种图形式化与已建立的理想合成概念具有相似性,但它是机器可读的,具有精确的原子和键映射,并且不需要标记反应类型来将氧化还原操作等低影响反应与有影响的环加成或级联反应区分开来。因为图捕捉了每个键的确切位置,图编辑距离在突出关键转换的影响方面优于其他指标,例如基于摩根指纹的 Tanimoto 距离。通过图编辑距离对已发表的全合成进行的研究表明,不同的关键步骤很容易可视化。

对到达 1 的最短计算路径的全图分析揭示了曼尼希耦合的影响,在图编辑距离图中,曼尼希耦合表现为最陡峭的下降步骤。

 

在第一次合成中(图 3),目标是尽可能保持 CASP 预测的路线,但根据描述进行了一些修改。

图 3:1 依赖于不对称有机催化曼尼希反应的全合成。(来源:论文)
合成分六步进行,仅需要四次色谱纯化,标志着 1 的对映选择性全合成时间最短。为方便起见,选择使用 L-脯氨酸制备 (+)-1,尽管软件准确识别出 D-脯氨酸会生成 (–)-1。

研究人员通过对计算路线的修改产生的实验路线进行了图编辑分析。在这里,曼尼希烯丙基化关键步骤的高影响显而易见,而随后完成合成所需的官能团相互转换的影响也很低。

为了在步数方面取得最好的结果,研究人员生成了数百条额外的计算路线到 1,以及相关的后期中间体,例如 20,寻找可以重新利用的关键步骤。

在第二条路线中,专注于从多个计算路线中合并有趣的关键步骤。图编辑距离分析用于将注意力引导到 CASP 计算路线的关键步骤,并促进多个关键步骤的组合。

研究人员编辑的逆合成策略最大化了高影响步骤并最小化了低影响步骤,以得出合成 1 的简明建议。

图 4:以 Schmidt-Aubé 重排为特征的 1 的全合成。(来源:论文)
最长的线性序列是三步,目标总产量为 22%,从而将之前的步数减半。

在 1 的六步合成中可以很容易地观察到步骤影响,其中第一个有机催化曼尼希烯丙基化步骤显着增加了 3、5 和 4 到 1 的图相似性,安装了产生 1 所需的 45% 的键。这个高影响步骤之后是一系列低影响步骤。同时,3 步路线效率更高,步骤序列分别为中间体与 1 的图相似度贡献 17%、55% 和 28%。研究使用的关键步骤是从对一千多个计算的逆合成路线的分析中选出的。

除了突出显示关键步骤外,图编辑距离技术还可用于突出显示路线中的捷径,这可能需要发明新的反应。这很容易通过将图编辑图中具有适度斜率的相邻转换分组为一个快捷步骤来实现。

现代 CASP 已经展示了为适度复杂目标生成可行路线的能力,但迄今为止,路线建议并未挑战现代人类衍生路线的简洁性。研究人员的方法表明,可以将来自不同 CASP 路线建议的多个高影响步骤结合起来,以得出简洁的合成路线。

在当前的研究中,将步数作为唯一的优化指标,但重要的现实世界指标,如试剂成本、构建块可用性或预测产量,可以很容易地作为加权距离指标纳入。随着自动逆合成的进步使复杂的分子更容易获得,精密药物可能会变得越来越容易获得。

随意打赏

提交建议
微信扫一扫,分享给好友吧。