社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Cell | 万物可控:机器学习如何解锁蛋白质“开关”,开启活体按需功能调控新时代?

生物探索 • 2 周前 • 66 次点击  

引言

想象一下,如果生命中的每一个蛋白质(protein)都能像电视开关一样,被你精准地开启或关闭,那将是怎样一番景象?作为生命机器的精密部件,蛋白质的功能是所有生物活动的基石。然而,长期以来,研究人员面临着一个巨大的挑战:如何在复杂的活体(in vivo)环境中,以前所未有的精度对特定蛋白质进行按需(on-demand)调控?传统的光控(photo-control)方法往往受限于光线穿透深度,难以触及深层组织;而复杂的基因工程(genetic engineering)手段又可能改变蛋白质的天然功能,甚至引发意想不到的副作用。

难道,精准“遥控”生命仅仅是一个遥远的梦想?
好消息来了!5月27日《Cell》上发表了一项里程碑式的研究“Machine-learning-assisted universal protein activation in living mice”,为我们带来了梦想中的“生命遥控器”——CAGE-Proxvivo 策略。这项颠覆性技术,首次实现了在活体小鼠(living mice)体内,对多种蛋白质进行精准、通用、可逆的化学激活和功能调控!
这套系统,核心原理在于给目标蛋白质穿上一个特制的“隐身衣”(笼子),暂时“锁住”它的功能。当需要时,只需注入一把特定的“钥匙”,就能在活体环境中精确“揭开”这层隐身衣,让蛋白质瞬间“重获自由”,恢复其天然活性。这把“钥匙”的制造和“隐身衣”的精准设计,得益于最前沿的机器学习(Machine Learning) 技术!它如何帮助科学家们巧妙地改造蛋白质,实现前所未有的生命“遥控”?它又将如何彻底改变我们对生命调控的认知和疾病干预的方式,为肿瘤治疗、免疫调节等领域带来革命性突破?
解锁生命“遥控器”:CAGE-Proxvivo 的核心原理
在CAGE-Proxvivo策略中,研究团队巧妙地将蛋白质的“开关”功能设计成了一套“笼子”(cage)与“钥匙”(key)系统。想象一下,一个微小的“笼子”被精巧地安装在蛋白质的关键位置,暂时“锁住”了它的功能。当需要激活蛋白质时,只需递送一把特定的“钥匙”,就能在活体环境中将“笼子”移除,让蛋白质重新“自由”,恢复其天然活性。
这项技术的关键在于引入了一种独特的非天然氨基酸(unnatural amino acid, ncAA)—— TCOY (trans-cyclooctene-caged tyrosine)。TCOY是一种被“笼子”包裹的酪氨酸(tyrosine)衍生物。当TCOY被遗传编码(genetically encoded)到蛋白质的活性位点(active site)或关键相互作用界面附近时,它庞大的体积会形成空间位阻(steric hindrance),有效抑制蛋白质的功能。
那么,如何“解开”这个“笼子”呢?研究团队选择了生物正交裂解反应(bioorthogonal cleavage reaction)中效率极高、对活体兼容性极强的 逆电子需求Diels-Alder反应 (inverse-electron-demand Diels-Alder reaction, IEDDA)。他们合成了一系列叠氮化四嗪(tetrazine, Tz)衍生物作为“钥匙”。实验发现,在所有测试的四嗪“钥匙”中,3,6-二甲基-1,2,4,5-四嗪(Me2Tz) 表现出最高的解笼效率,在实验条件下,仅需30分钟就能使TCOY的脱笼率达到惊人的80%以上。这意味着,Me2Tz能够快速、高效地“解锁”TCOY,从而恢复蛋白质功能。
与传统的光控方法相比,化学小分子(small molecule)介导的脱笼(decaging)具有无可比拟的优势,尤其是在活体应用中。小分子可以克服紫外光(UV light)穿透深度有限的问题,轻松到达小鼠体内的深层组织,实现对各种器官、细胞和生物过程的精准操控,真正做到“按需激活”。CAGE-Proxvivo的诞生,正是为解决活体环境中蛋白质调控的普适性与精准性难题而生。

“智慧”进化:机器学习如何加速生物发现
要将TCOY这个“笼子”精准地安装到目标蛋白质的特定位点,需要一种特异性的“工具”——氨酰tRNA合成酶(aminoacyl-tRNA synthetase, aaRS)。然而,自然界中并没有能够识别TCOY的aaRS,这意味着研究人员必须对现有的aaRS进行“定向进化”(directed evolution),改造它们使其能够特异性地识别TCOY,并将其连接到tRNA(转运RNA)上,最终通过遗传密码扩增(genetic code expansion, GCE)技术将TCOY插入到目标蛋白质中。
传统的aaRS定向进化是一个浩大且充满挑战的工程,它涉及到巨大的序列空间探索、复杂的功能筛选,就像在浩瀚的沙海中寻找一颗特定的珍珠。为了加速这一过程,研究团队引入了机器学习这一“智慧”助手。

他们构建了一个创新的机器学习流程:
数据收集与准备:首先,研究团队收集了117个已知的aaRS突变体库,并系统地筛选了七种酪氨酸类似物,评估它们与aaRS突变体之间的识别效率。初步测试发现,没有一个现有的aaRS突变体能有效识别TCOY。
特征提取与模型训练:他们将蛋白质序列数据(sequence-based features)和结构数据(structure-based features)结合起来。序列特征来源于最先进的蛋白质语言模型(protein language models),如UniRep(统一表征模型)和ESM(进深标度模型),这些模型能够从海量蛋白质序列中学习到蛋白质的内在规律。结构特征则通过AlphaFold2预测蛋白质结构,并利用RosettaLigand(罗斯塔配体)和CartesianDDG(笛卡尔差分增益)等计算方法,精确模拟aaRS与TCOY的相互作用能量和空间位阻。
所有这些特征被整合起来,输入到一个经过监督学习(supervised learning)训练的二元分类器(binary classifier)中。这个分类器能够根据输入特征,预测aaRS突变体识别TCOY的效率。
智能筛选与实验验证:模型根据预测的识别效率对aaRS突变体进行排名。研究团队选择了预测得分最高的12个PyIRS(pyrrolysine-aaRS)变体进行实验验证。最终成功筛选出两个能够高效将TCOY插入绿色荧光蛋白(GFP)的PyIRS突变体!
通过液相色谱-质谱联用(LC-MS)分析,研究人员进一步验证了TCOY成功编码到GFP中的高保真度(fidelity)以及Me2Tz诱导的脱笼效率。例如,带有TCOY笼子的GFP(GFP-N149TCOY)的预期分子量为27880 Da,经过Me2Tz处理后,成功脱笼产物GFP-N149-Y的分子量变为27772 Da,这与预期结果高度一致,证实了脱笼的有效性。此外,该技术还成功将TCOY插入活细胞膜上的视紫红质(rhodopsin)中,展示了其在膜蛋白(membrane proteins)应用上的巨大潜力。
这项工作首次将机器学习引入aaRS进化领域,不仅加速了特定非天然氨基酸的发现,更重要的是,它提供了一个通用框架,未来有望应用于更多类型非天然氨基酸的遗传编码,极大地拓展遗传密码扩增技术的应用范围。

从“沉睡”到“觉醒”:体内蛋白激活的魔力
有了能够精准编码和高效脱笼TCOY的工具,研究团队迫不及待地将CAGE-Proxvivo策略推向了活体动物实验。他们选择萤火虫荧光素酶(firefly luciferase, fLuc)作为模型蛋白,因为其生物发光(bioluminescent)强度能够直观地反映蛋白质的活性变化。
通过计算筛选,研究团队找到了fLuc催化口袋(catalytic pocket)附近的关键“锚定位点”(anchor sites)。他们发现,在fLuc的F250或Y255位点引入TCOY,可以有效抑制fLuc的活性。当对这些笼罩的fLuc进行化学脱笼后,其活性可以得到显著恢复。具体数据显示,fLuc-F250TCOY在脱笼后活性提高了10倍以上。
更令人兴奋的是活体实验结果。研究人员将表达TCOY笼罩fLuc变体(fLuc-F250TCOY)的HEK293T(人胚肾293T)细胞皮下移植到小鼠体内,形成异种移植模型(xenograft model)。随后,通过尾静脉注射(tail-vein injection)Me2Tz“钥匙”,成功在活体小鼠体内诱导了IEDDA反应,使fLuc活性得到显著恢复,小鼠体内的生物发光强度随之升高。
CAGE-Proxvivo的潜力远不止于此。研究团队进一步将其应用于一种强大的治疗性蛋白质——炭疽致死因子(anthrax lethal factor, LF)。LF是炭疽毒素(anthrax toxin)的关键组分,能够通过裂解促分裂素原活化蛋白激酶激酶(MAPK kinase, MEK3)诱导细胞凋亡(apoptosis)。然而,直接使用LF具有全身毒性。研究团队巧妙地将LF的活性位点(Y659)笼罩,形成LF-Y659TCOY。
为了实现肿瘤特异性激活,他们将LF-Y659TCOY与表皮生长因子-保护性抗原(EGF-PA)融合。EGF-PA能够特异性靶向过表达表皮生长因子受体(EGFR)的肿瘤细胞。实验证明,这种笼罩的LF-Y659TCOY仅在EGFR过表达的A431(人表皮样癌)细胞中,且在Me2Tz脱笼后才引起MEK3的裂解和细胞死亡,而对EGFR缺陷的A375细胞则没有影响。
在活体肿瘤模型中,CAGE-Proxvivo展示了其强大的抗肿瘤潜力。将表达EGFR的A431细胞移植到小鼠体内形成肿瘤。通过腹腔注射(intraperitoneal injection)EGF-PA/LF-Y659TCOY,并在一天后尾静脉注射Me2Tz,成功在肿瘤部位激活LF。实验结果显示,经EGF-PA/LF-Y659TCOY结合Me2Tz治疗的小鼠,肿瘤生长受到了显著抑制,肿瘤体积在整个实验周期内均远小于对照组小鼠。这表明CAGE-Proxvivo能够实现肿瘤细胞特异性激活,有效杀伤肿瘤。
更值得关注的是,研究团队还利用CAGE-Proxvivo成功诱导了肿瘤细胞的细胞焦亡(pyroptosis)。细胞焦亡是一种伴随炎症(inflammatory)反应的程序性细胞死亡,能够释放多种细胞因子,激活机体的抗肿瘤免疫(antitumor immunity)。实验数据显示,LF处理可以诱导小鼠肺癌LLC细胞发生细胞焦亡,表现为显著的乳酸脱氢酶(LDH)释放、碘化丙啶(propidium iodide, PI)染色阳性、半胱天冬酶-8(caspase-8)和半胱天冬酶-3(caspase-3)的激活以及膜蛋白焦亡素E(GSDME)的裂解。在活体小鼠中,肿瘤部位的LF激活导致CD3阳性T细胞(CD3+ T cells)和CD8阳性T细胞(CD8+ T cells)等免疫细胞数量显著增加,并进一步抑制了肿瘤生长。这为开发新型免疫疗法(immunotherapy)提供了新的思路。

精准“把脉”:调控蛋白间相互作用
蛋白质-蛋白质相互作用(protein-protein interactions, PPIs)是所有生命活动的核心,它们调控着细胞信号传导(cell signaling)、基因表达(gene expression)以及抗体-抗原识别(antibody-antigen recognition)等关键过程。精准调控PPIs对于理解疾病机制和开发靶向药物至关重要。
研究团队进一步将CAGE-Proxvivo策略拓展到PPIs的调控。通过对331个已知PPI界面的氨基酸丰度(amino acid abundance)和结合亲和力(binding affinity)影响进行分析,研究人员发现,酪氨酸(tyrosine) 在PPI界面中出现的频率较高,且将其突变为其他氨基酸对蛋白质稳定性的影响最小。这证实了酪氨酸是PPI操作中理想的“界面笼子”(interface cage)残基。
为了验证这一概念,他们使用了裂解型荧光素酶(split fLuc)作为报告系统。研究团队发现,在fLuc的界面位点(如I423和F465)引入TCOY,可以有效抑制其相互作用,而Me2Tz的加入则能使其恢复活性,激活效率均达到10倍以上。
随后,研究团队将CAGE-Proxvivo应用于调控肿瘤免疫(tumor-immune)界面的关键PPI——程序性死亡受体1(PD-1)与其配体PD-L1(PD-L1)之间的相互作用。PD-1/PD-L1通路是肿瘤细胞逃避宿主免疫清除的重要检查点。实验结果显示,在PD-L1的Y123位点引入TCOY(PD-L1-Y123TCOY)后,其与PD-1的结合几乎完全被阻断,导致T细胞报告系统中的荧光素酶活性显著增强,表明检查点抑制被解除。而当加入Me2Tz进行脱笼后,PD-1/PD-L1的结合得到恢复,T细胞活性恢复到与野生型PD-L1相似的抑制水平。这充分证明了CAGE-Proxvivo能够精确地化学调控细胞表面的PPIs,为肿瘤免疫检查点(immune checkpoint)调控提供了新策略。

“智能”抗癌:生物正交门控抗体引发免疫风暴
在肿瘤治疗领域,T细胞衔接器(T cell engager, TCE)双特异性抗体(bispecific antibody)因其能够募集T细胞攻击肿瘤细胞而备受关注。然而,传统TCEs的潜在脱靶毒性(off-target toxicity)和全身性细胞因子释放综合征(cytokine release syndrome, CRS)是其临床应用的主要障碍。为了提高安全性,研究团队提出了一种“逻辑门”(logic gate)策略,即T细胞的激活必须满足多个条件才能开启。
CAGE-Proxvivo为实现这种“门控”抗体(gated antibody)提供了理想的平台。他们设计了一种生物正交门控的抗CD3抗体(anti-CD3 antibody, aCD3),通过TCOY笼罩来控制其与T细胞表面CD3抗原的结合。研究团队以靶向HER2(人表皮生长因子受体2)的ZHER2-aCD3抗体为例进行验证。
他们发现,在aCD3的Y59位点引入TCOY(ZHER2-aCD3-Y59TCOY),几乎可以完全阻断其与CD3的结合,而Y103位点笼罩的抗体仅部分阻断。这使得T细胞在没有Me2Tz“钥匙”时,即使遇到肿瘤细胞,也不会被异常激活,从而降低了全身性毒性。当Me2Tz被注射到肿瘤部位后,Y59位点的TCOY被高效脱笼,抗体恢复了与CD3的结合能力,并以高荧光恢复率证实了结合的恢复。
活体实验进一步印证了门控抗体的优势。研究团队在小鼠模型中观察到,与传统TCEs相比,ZHER2-aCD3-Y59TCOY显著降低了小鼠血清中白介素-6(IL-6)和干扰素-γ(IFN-γ)等炎性细胞因子(inflammatory cytokine)的水平,这预示着更低的CRS风险,提高了治疗安全性。同时,化学脱笼后的ZHER2-aCD3-Y59TCOY显著促进了T细胞向肿瘤组织的浸润(infiltration),并有效抑制了肿瘤生长。在NOD-SCID(非肥胖糖尿病-严重联合免疫缺陷)小鼠模型中,ZHER2-aCD3-Y59TCOY与Me2Tz的联合治疗,使得肿瘤体积得到了显著抑制,肿瘤增长速度远低于对照组。
这项工作还展示了CAGE-Proxvivo的通用性。除了酪氨酸,研究团队还成功地将另一种重要的非天然氨基酸——TCO-半胱氨酸(TCO-cysteine, TCOC)进行遗传编码。半胱氨酸(cysteine)在蛋白质功能中扮演着多种重要角色。通过机器学习辅助,他们同样找到了能够高效识别TCOC的PyIRS变体,并验证了其在活体细胞中激活海肾荧光素酶(Renilla luciferase, RLuc)的能力。TCOC的成功编码,进一步证明了CAGE-Proxvivo作为通用平台的强大潜力。

开启生物医学新纪元
CAGE-Proxvivo策略的成功开发,是蛋白质工程和化学生物学领域的里程碑。它实现了在活体小鼠体内对蛋白质功能、蛋白质-蛋白质相互作用的按需精准化学调控,其核心优势在于:
普适性:该平台能够适用于多种不同类型的蛋白质,包括酶(enzymes)、受体(receptors)和抗体(antibodies)等。
活体兼容性:化学小分子诱导的脱笼克服了传统光控技术的组织穿透深度限制,使得深层组织和器官的蛋白质调控成为可能。
机器学习赋能:首次将蛋白质语言模型与结构建模相结合,极大地加速了非天然氨基酸遗传编码体系的开发效率,为未来更广泛的非天然氨基酸应用奠定基础。
精准调控:无论是激活单个蛋白质的功能,还是调控复杂的蛋白质相互作用网络,CAGE-Proxvivo都能提供高精度的时空控制。
这项技术不仅为基础生物学研究提供了强大的“功能获得性研究”(gain-of-function study)工具,帮助研究人员更深入地理解复杂生命过程的动态变化,更在转化医学(translational medicine)领域展现出巨大的应用前景。例如:
新型前药(prodrug)设计:将药物活性组分以笼罩形式递送,仅在病灶部位(如肿瘤)激活,从而最大程度地降低全身毒副作用,提高治疗效率。
精准免疫疗法:开发“门控”抗体和T细胞衔接器,在特定条件下激活免疫细胞,避免脱靶效应和细胞因子风暴。
其他疾病治疗:该平台有望应用于自身免疫性疾病(autoimmune diseases)、神经退行性疾病(neurodegenerative disorders)和代谢性疾病(metabolic conditions)等领域,实现对异常蛋白质功能的精准干预。
当然,CAGE-Proxvivo策略仍有提升空间,例如进一步扩展非天然氨基酸的种类、优化小分子触发器的药代动力学(pharmacokinetics)特性以及提高蛋白质在活体内的递送效率等。但毫无疑问,这项创新成果为我们提供了一个前所未有的窗口,去探索生命的奥秘,并为攻克人类疾病带来新的希望。
未来,我们或许真的能手握“遥控器”,在生命舞台上,精准地编织出我们期待的华章!




参考文献


Wang X, Liu Y, Wang Z, Zeng X, Ngai WSC, Wang J, Zhang H, Xie X, Zhu R, Fan X, Wang C, Chen PR. Machine-learning-assisted universal protein activation in living mice. Cell. 2025 May 20:S0092-8674(25)00517-3. doi: 10.1016/j.cell.2025.05.006. Epub ahead of print. PMID: 40436016.


声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!




往期热文:


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182744
 
66 次点击