Py学习  »  机器学习算法

【有机】Angew:高通量实验与机器学习辅助的叶立德选择性交叉二聚

X-MOL资讯 • 6 月前 • 98 次点击  


烯烃的合成在有机合成领域一直以来都备受化学家的关注,特别是不对称烯烃的合成尤为重要,因为这类烯烃广泛地存在于天然产物中并且在化学合成和材料领域也有丰富的应用场景,也因此,不对称烯烃合成方法的开发受到广泛的关注。迄今为止,经典的Wittig型反应和烯烃的复分解仍然是快速构建C=C键的重要方法。近几年来,过渡金属催化/光促进的重氮交叉偶联反应已经成为构建不对称烯烃的有效策略。2011年,Davies课题组首次实现了在Rh催化下,两种重氮化合物通过交叉偶联反应,选择性地得到三取代不对称E式烯烃(图1A)。另外,孙江涛课题组于2014年,通过Au催化体系,也实现了两种重氮化合物交叉偶联反应,选择性地得到四取代不对称Z式烯烃(图1B)。在此之后,Maulide课题组利用Ru催化,成功实现了重氮和β-酮羰基亚砜硫叶立德之间的交叉偶联,并最终得到不对称Z式烯烃(图1C)。近几年来,Aïssa团队和其他化学家们将亚砜硫叶立德作为卡宾前体成功应用到C-H键活化、C-X键插入与环丙烷化等选择性转化反应,极大地促进了硫叶立德化学的发展。然而,在已报道的卡宾通过交叉偶联反应合成烯烃的策略中,将亚砜硫叶立德作为卡宾前体通过交叉偶联的方式合成不对称烯烃的方法却一直没有进展。这主要是由于亚砜硫叶立德存在难以控制的均二聚反应以及进一步环丙烷化反应。

近年来,高通量实验与人工智能技术在有机化学领域的应用逐渐受到越来越广泛的关注。广州国家实验室廖矿标团队一直致力于实现化学合成自动化与智能化,不仅建立了可以覆盖化学合成全流程的自动化高通量化学合成平台,建立了拖拽式的机器学习建模平台,还将自动化高通量与人工智能技术成功应用于新型合成方法学开发(部分工作请参见X-MOL前期报道——“廖矿标/杨跃东课题组Chem:自动化与深度学习促进的受阻间位sp² C–H键选择性活化”)。

为了解决硫叶立德选择性交叉二聚的难题,该团队基于高通量实验与机器学习技术发展了一种铱催化硫叶立德选择性交叉偶联的新反应。通过高通量实验技术首次发现了两种硫叶立德间选择性交叉偶联反应,并通过机器学习建立预测模型,实现对未知反应产率的精准预测(图1D)。

图1. 过渡金属催化重氮或亚砜硫叶立德交叉偶联反应

首先,作者通过自主搭建的自动化高通量化学合成平台对24种催化剂和4种溶剂组合进行了条件优化(图2),在[Ir(COD)Cl]2作为催化剂,DCM作为溶剂的条件下,反应产率达到了68%,之后为了进一步提高反应的产率和选择性,作者又对反应的温度和底物的比例做了一系列的筛选,最终在[Ir(COD)Cl]2(5 mol%)作为催化剂,DCM作为溶剂,1a:2a = 1:1.5在-10 ℃下,以78%的产率,E/Z=7/1的选择性得到了E式产物3

图2. 反应条件筛选(通过自主搭建的自动化高通量平台)

在最佳反应条件下,作者对各种取代的酰胺基亚砜硫叶立德和β-酮羰基亚砜硫叶立德底物的适用范围进行了考察(图3)。结果显示,反应对于(杂)芳基、烷基、环烷基、吲哚、吡咯等其他氮杂环硫叶立德都能以较高选择性得到不对称E式烯烃,兼容卤素、三氟甲基、酯、腈、酮、硝基与氨基等重要官能团。

图3. 底物拓展

通过高通量实验,作者收集到了大量的标准化数据(600个反应),其中351个反应数据用于建模(包括9种酰胺基亚砜硫叶立德、26种β-酮羰基亚砜硫叶立德和13种N-杂环亚砜硫叶立德,图4A),另外249个反应用作评估模型预测能力的外部测试集(模型未曾见过的反应,图4D)。在这项研究中,反应物和产物的描述符被用作模型输入,反应产率被定义为模型输出。值得注意的是,该研究使用了作者团队开发的一种新的简单描述符,称为分子加成指纹(MAF)。结果表明,MAF在反应预测方面比其他描述符(One-hot和RDKit)更有效。使用MAF描述符,评估了4种ML方法,包括支持向量回归(SVR)、梯度增强树(GBT)、随机森林回归(RF)和极限梯度增强(XGB)。通过对模型参数的优化以及5折交叉验证,XGB-MAF建模效果达到了R2 = 0.88,MAE = 6.8%,RMSE = 8.8%(图4B和4C)。并且该模型对于外部测试集的预测效果依然有较好的结果,R2 = 0.80,MAE = 7.4%,RMSE = 9.8%(图4E)。并且通过分析产模型对产率预测结果,作者发现,具有高亲核性的β-酮羰基亚砜硫叶立德往往会有较高的产率,例如,当β-酮羰基亚砜硫叶立德的苯环上有给电子基团时,这类底物的亲核性通常会比苯环上具有吸电子基团的底物高,这也导致了具有给电子基团的反应产率会相对较高,并且模型为这类底物给出了相对较高的产率预测;当亲核性相对较弱的烷基取代的底物参与反应时,模型也会给出相对较低的产率预测。并且可能由于烷基类底物的位阻的影响,这类底物的产率预测可能存在一定的误差(图4F)。

图4. 机器学习预测模型的优化与分析

为了证明所合成的不对称E式烯烃具有很广泛的应用场景,作者首先进行了克级制备实验(图5A),以67%的产率,E/Z=7/1的选择性拿到了1.10 g的目标产物3。对于双取代的β-酮羰基亚砜硫叶立德以较高的产率(62%)得到了双E式产物84(图5B)。作者从产物3出发,通过与EDA反应得到了三取代吡唑86;利用LiAlH4的还原,得到了仲醇87;用格氏试剂加成得到了叔醇产物88(图5C)。

图5. 合成应用

为了更深入的研究反应机理,通过一系列的控制实验和结合理论计算揭示了反应的选择性(图6),在反应过程中,铱催化剂会先与酰胺基亚砜硫叶立德快速形成金属铱卡宾,脱掉一分子DMSO,随后β-酮羰基亚砜硫叶立德作为亲核试剂,进攻金属铱卡宾中心,释放出另一分子DMSO,随后C–Ir键的迁移导致了C=C键形成,最终得到E式产物,释放铱催化剂,完成催化循环。

图6. DFT计算机理

小结

作者利用高通量实验与机器学习技术发展了铱催化两种硫叶立德选择性交叉二聚反应,在该反应中,铱催化剂选择性与酰胺亚砜硫叶立德率先形成金属铱卡宾中间体,另一种亚砜硫叶立德作为亲核试剂,实现了E式不对称官能团取代烯烃的绿色、高效合成,这是第一例两种亚砜硫叶立德间选择性交叉偶联的反应。该反应为构建含酰胺、酮、酯和N-杂环官能团取代的不对称E式烯烃提供了一种新颖简便的方法,并通过高通量实验与机器学习技术,初步实现了对该反应的化学空间探索。最后,这样一个自动化高通量与机器学习技术相结合的新反应开发模式,有望可以促进有机化学与人工智能的更好地结合,为新反应发现注入新的动力。

该成果近期发表在国际学术期刊Angew. Chem. Int. Ed.上,第一作者为廖矿标课题组的研究实习员徐友根(高通量实验和机器学习)和高亚东博士(理论计算),苏乐斌副研究员和廖矿标研究员为该论文的共同通讯作者。广州实验室伍海婷、田浩博士、曾马健参与了该工作,广州标智未来科学技术有限公司的徐春秋、朱新伟负责模型验证研究。该研究工作得到了国家自然科学基金委(22002169、22071249)、广东省基础与应用基础研究基金(2019A1515111111)和广州实验室等科研项目的经费支持。

原文(扫描或长按二维码,识别后直达原文页面):
High-Throughput Experimentation and Machine Learning-Assisted Optimization of Iridium-Catalyzed Cross-Dimerization of Sulfoxonium Ylides
Yougen Xu, Yadong Gao, Lebin Su,* Haiting Wu, Hao Tian, Majian Zeng, Chunqiu Xu, Xinwei Zhu, and Kuangbiao Liao*
Angew. Chem. Int. Ed., 2023, DOI: 10.1002/anie.202313638

通讯作者简介

廖矿标,广州实验室研究员,博士生导师,国家高层次青年人才,广东青年五四奖章获得者。课题组长期致力于利用自动化、高通量、人工智能等现代化学技术,开发新型合成方法学,建立人工智能反应预测模型,聚焦呼吸系统疾病开展新药研发。具体的研究方向包括:1. 合成方法学:围绕惰性化学键精准转化开发方法学;2. 反应预测模型:利用自动化高通量技术,收集标准化的反应数据,建立人工智能反应预测模型,实现合成路径、反应条件或反应结果的精准预测;3. 呼吸系统疾病新药研发:开发新型化合物库合成以及活性筛选工具,研发抗冠状病毒的小分子药物。至今,已以通讯作者或第一作者在Nature(2篇)、Nature Chemistry、Chem、Angew Chem、ACS Catalysis等期刊发表系列论文。

苏乐斌,广州实验室副研究员。目前研究兴趣集中在高通量实验和人工智能辅助的碳氮键选择性转化反应开发及其含氮化合物在呼吸疾病相关药物研发中的应用。至今,以第一作者或通讯作者在 J. Am. Chem. Soc., Angew. Chem. Int. Ed., Org. Lett., Org. Chem. Front., Chem. Eng. Sci.等杂志上发表系列论文,主持国家自然科学基金项目2项。

廖矿标课题组网站:
https://www.x-mol.com/groups/Liao_Kuangbiao



点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/163420
 
98 次点击