近期,西北工业大学生命学院施建宇教授团队在多任务图表示学习助力单步逆合成预测的方向上展开研究并取得了进展。这项名为“Single-step Retrosynthesis Prediction via Multitask Graph Representation Learning”的研究成果被发表在国际著名期刊《Nature Communications》(IF=14.7)上。该工作得到了国家自然科学基金和陕西省重点研发计划等科研项目的资助。生命学院博士生赵鹏程为论文的第一作者,西北工业大学生命学院施建宇教授、尚洁副教授和中国中医科学院中医临床基础医学研究所吕诚研究员作为该成果的共同通讯作者。
图1. Retro-MTGR的工作流程图
一旦在计算机中确定了小分子的化学结构,逆合成推理就可以确定可用于合成目标分子的反应物。这种逆合成过程充当从计算机模拟到体外设置的桥梁。与合成反应相比,逆合成是一个逆向推理过程。完整的逆合成过程是一个树状路线,其中根节点(目标分子)递归分解为其后代节点(反应物),直到达到市售的反应物。每个分解阶段称为单步逆合成过程。在过去的几十年里,计算机赋能化学分子的数字化表示使得化学分子单步逆合成路径的智能化推断成为一种新的有前途的方法。
为了开发一个高度可解释的模型来揭示化学合成机制,这项工作提出了一个 Retro-MTGR 框架(图1)。基于分子图,Retro-MTGR同时学习了三个相关任务( 多任务学习),其中两个主要的任务负责识别反应中心和离去基,而辅助任务负责生成更好的原子嵌入。研究中,作者通过回答两个关键问题来验证Retro-MTGR 预测化学合成过程的可解释性:
(1)为什么键可以成为反应中心?
(2)哪些离去基适合于给定的合成子?
结果表明,Retro-MTGR 可以捕获和说明潜在的化学合成规则。
具体来说,键的嵌入空间说明了为什么键是或者不是反应中心(图2):a.具有高键能(>=360 kJ/mol) 的键(例如,双键、三键和芳香键)始终是普通键。b.具有较低键能(<360 kJ/mol)的单键(例如,C-N 和 C-O)由于其合成子的分子结构不同,可能属于普通键或者反应中心。c.键中包含的原子对的电性分布表明,反应中心中的两个原子往往具有相反的电性,普通键则通常是相同或者相似的电性。
图2.化学键嵌入空间的展示
合成子和离去基的联合嵌入空间表明:a.反应中的两个合成子总是具有相反的电性 并且彼此相距甚远。b.属于同一个反应物的合成子和离去基通常具有相反的电性并且彼此靠近。c.反应中同时出现的两个离去基经常具有相反的电性并且彼此相距甚远(图3)。
图3.合成子和离去基的联合嵌入空间展示
最后,研究通过两种新药的合成实验评价了Retro-MTGR的实用能力(图4)。具体来说,该研究通过对两种药物分子(Sonidegib和Acotiamide)的逆合成路线进行预测推断,然后根据推断路径尝试上述两种药物分子的化学合成。最终结果表明Retro-MTGR 推断的逆合成路线与化学合成测定获得的逆合成路线一致。这充分证明,Retro-MTGR可以为逆合成路线规划提供指导。
图4. 对于两种药物的预测逆合成路线和真实化学合成路线展示
发表论文:
Zhao, PC., Wei, XX., Wang, Q. et al. Single-step retrosynthesis prediction via multitask graph representation learning. Nat Commun 16, 814 (2025). https://doi.org/10.1038/s41467-025-56062-y.
(图/文:赵鹏程、施建宇;审核:杨慧)