近日,西湖大学理学院陆海华与浙江大学药学院张鹏鹏团队在Journal of the American Chemical Society 上发表研究论文。该研究基于机器学习模型,设计并合成了一类新型BI-DIME单磷配体,实现了2-溴咔唑与环己酮之间的α-芳基化反应,高对映选择性地构建了关键季碳中心;并发展了一类温和的TMS导向的分子内傅克反应,以及单线态氧引发的呋喃Achmatowicz重排与酸催化缩酮环化的一锅反应,实现了咔唑萜类生物碱 (+)-shearilicine的7步高效催化不对称全合成。
咔唑萜类生物碱因其显著的生物活性和复杂的结构特征,在有机合成领域备受关注。其中,从姜科植物的内生真菌Penicillium sp.中分离得到的shearilicine尤为引人注目。该分子含有一个高度官能团化的6,8-二氧杂双环[3.2.1]辛烷骨架,这一结构单元此前仅在paspaline衍生的吲哚二萜类天然产物中出现过。Shearilicine是迄今为止该家族中首个将该双环结构单元与十氢萘骨架的咔唑母核相结合的天然产物。这种独特的结构特征为化学合成带来了独特而艰巨的挑战也因此引起了合成化学家的研究兴趣。美国耶鲁大学的Newhouse课题组报道了该分子的首次全合成(J. Am. Chem. Soc. 2023, 145, 4394),他们通过分子内杂-Pauson-Khand反应构建反式十氢萘环以及Heck反应构筑咔唑环,总步数为11步;近期,印度的Bisai课题组基于Noyri氢化以及分子内烯炔环化反应报道了该分子的第二例全合成(24步)(Org. Lett. 2025, 27, 9281)。
不同于前人,针对该天然产物特征性的全碳季碳中心,陆海华/张鹏鹏团队提出了官能团化的化合物11和咔唑12的不对称α-芳基化反应,并基于机器学习辅助配体设计的策略完成季碳中心的构建,进而结合硅基导向的分子内傅克反应实现shearilicine的高效不对称全合成(图1)。
图1. (a) 代表性的咔唑萜类生物碱; (b) 逆合成分析; (c) 机器学习辅助配体设计
研究团队首先对化合物11和12的不对称α-芳基化反应进行研究。初筛过程,发现配体对该反应影响显著,研究发现汤文军教授发展的BI-DIME类配体效果有效(Acc. Chem. Res. 2019, 52, 1101–1112)。随后结合立体及电子效应对该类配体结构进行理性设计和合成,共收集了三十余个配体结构的实验数据(0% ee-88% ee)。
图2. Pd催化的对映选择性α-芳基化反应的初步筛选结果
考虑到对这些新型配体进行进一步优化需要投入大量的时间和成本,作者计划采用机器学习模型来预测新设计配体的性能。该方法的目的是通过虚拟筛选指导结构修饰,从而大幅减少所需的合成工作量。这种研究范式转变构建了一个数据驱动的创新框架,使机器学习模型成为化学家的"虚拟协同设计师",既突破了传统试错法的局限性,又加速了高性能催化剂的发现进程。
图3. 机器学习辅助配体优化
研究团队基于前期自由基环化反应产率预测模型开发的经验(Nat. Synth. 2023, 2, 527,点击阅读详细),建立了ML辅助配体优化四阶段流程(图3a):(1)数据收集:以32种BI-DIME型单磷配体的实验结果构建数据集,以ΔΔG‡为目标变量。(2)特征工程:采用简化的“配体–Pd复合物”,进行DFT计算并提取150余个描述符,经Spearman过滤和PCA降维至7个主成分,累计解释86.5%方差。(3)模型训练:比较六种机器学习模型后,以支持向量机SVR模型表现最优。训练集Q² LOOCV = 0.90,测试集R² = 0.72、MAE = 0.22 kcal/mol,四项检验证实了模型的可靠性。(4)虚拟筛选与实验验证:经SHAP分析锁定P–Pd单元及R⁴区域为影响选择性的关键位点。进而设计并虚拟筛选120余种配体,并成功合成了预测值ddG高于已有配体的新型配体V51,其100℃下获得88% ee,经过优化反应温度,在60℃下进一步提高至90% ee,超越此前所有配体。另一方面,模型成功预测配体V2的立体选择性反转,证明其真正理解了结构与选择性的内在规律。
完成上述关键的不对称α-芳基化反应后,作者随即开展了全合成的后续研究。如图4所示,化合物14经一锅法的溴代/Suzuki偶联反应转化为化合物11,随后通过不对称α-芳基化反应构建关键季碳中心,得到化合物16。接着进行1,2-加成并尝试关环,但仅获得羟基异构化的副产物。作者认为,烯丙醇在酸性条件下脱水生成烯丙基正离子,由于邻位季碳中心的位阻效应,该正离子倾向于远离咔唑环,从而被体系中的氢氧根负离子进攻,生成异构化产物。为解决此问题,作者利用硅基的位阻效应改变底物构象,成功实现了环化。随后,经过不对称Sharpless双羟基化反应及Pd/C氢化,以及发展的单线态氧介导的Achmatowicz重排/CSA催化的缩酮环化的一锅法反应,构建了6,8-二氧杂双环[3.2.1]辛烷结构,以42%的收率完成了天然产物(+)-shearilicine的7步高效全合成。
图4. 天然产物shearilicine的不对称全合成
综上所述,陆海华/张鹏鹏团队基于机器学习辅助的配体设计策略实现了天然产物shearilicine的高效对映选择性全合成。所建立的关键合成方法——包括新型单磷配体的发现、不对称α-芳基化反应、一类温和的TMS导向的分子内傅克反应,以及单线态氧引发的呋喃Achmatowicz重排与酸催化缩酮环化的一锅反应等——为复杂天然产物的合成提供了新范式,也为后续生物活性研究和药物开发奠定了重要基础。
本研究得到了科技部“科技创新2030——新一代人工智能”重大项目、国家自然科学基金、浙江省自然科学基金、西湖大学及西湖大学分子科学公共实验平台的支持。西湖大学理学院陆海华副教授和浙江大学药学院张鹏鹏研究员为该工作的共同通讯作者,浙江大学-西湖大学联合培养博士研究生倪富强和浙江大学药学院博士研究生王志豪为该工作的共同第一作者。张鹏鹏团队的李桢洵及陆海华团队研究助理张冰峰也对本研究做出了重要贡献。
原文(扫描或长按二维码,识别后直达原文页面):

Concise Total Synthesis of (+)-Shearilicine: A Machine Learning-Assisted Strategy for Ligand Optimization of an Enantioselective Palladium-Catalyzed α-Arylation
Fu-Qiang Ni, Zhihao Wang, Zhenxun Li, Bing-Feng Zhang, Pengpeng Zhang*, Hai-Hua Lu*
J. Am. Chem. Soc., 2026, DOI: 10.1021/jacs.5c21637
导师介绍
陆海华,西湖大学长聘副教授,于2010年获得有机化学理学博士学位(导师:肖文精教授,方向:不对称催化)。随后,进入药企从事药物合成工艺和抗癌新药的研发工作。他于2012年在德国汉诺威大学开展大环内酯类化合物的合成及相关化学生物学研究工作(合作导师:Markus Kalesse教授);2014年赴美国Scripps 研究所,从事萜烯类天然产物合成(合作导师:Ryan Shenvi教授)。2016 年9月入职南京工业大学先进化学制造研究院,并于2019年3月全职加盟西湖大学理学院。曾荣获德国洪堡基金会(洪堡学者)、Thieme Chemistry Journals Award(2021)等支助和荣誉。2025年2月起,任化学系长聘副教授。
课题组主页:
http://chem-lu.cn/
https://www.x-mol.com/university/faculty/849217
张鹏鹏,浙江大学药学院“百人计划”研究员,国家级优秀青年人才项目获得者,浙江大学医学院附属第二医院兼聘教授。2013年本科毕业于兰州大学化学基地班;2018年博士毕业于北京大学,师从于杨震教授;2018年至2023年在耶鲁大学 Timothy R. Newhouse课题组开展博士后研究。于2023年8月加入浙江大学药学院,药物发现与设计研究所,任“分子智造”课题组组长,博士生导师。主要从事:活性天然产物全合成、人工智能辅助的合成化学(AI for Chem)及药物化学、人工智能药学等研究。
课题组主页(博后及科研助理招聘中!!):
https://person.zju.edu.cn/ZhangPengpeng
https://www.x-mol.com/groups/Pengpeng_Zhang

点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊