Science | 基于光交联化学蛋白质组学揭示并预测配体-蛋白相互作用

  • A+
分享一篇发表在Science上的文章,题目为Large-scale chemoproteomics expedites ligand discovery and predicts ligand behavior in cells。本文通讯作者是奥地利科学院分子医学研究中心的Georg E. Winter教授。Georg Winter课题组的主要发展原癌基因的化学生物学调控方法,并且专注于蛋白靶向降解技术。


1
对蛋白质功能进行化学调控是阐明生物机制的重要实验方法,也是治疗人类疾病最常用的策略。然而,人类蛋白质组中约有80%的蛋白质缺乏注释的小分子配体,因此许多蛋白质,包括已确定的疾病靶标,都无法进一步阐明治病机理并发展治疗方法。
为了缩小这一差距,迫切需要采用无偏见的方法来推动配体的发现。本文中,作者制定了如下目标:(i) 识别数百个片段与蛋白质的相互作用,并将选定的片段推向细胞活性配体;(ii) 利用机器学习(ML)二元分类器开发模型,以预测小分子在天然生物系统中的行为;(iii) 建立一个交互式开源界面,以便广泛探索数据和所有预测模型。
2
作者从商业可及的全功能化小分子碎片库(fully functionalized fragments,FFFs)中挑选了407个,用其分别处理完整细胞,并基于光交联、CuAAC富集对FFF互作蛋白进行定量蛋白质组学分析。通过这种策略,作者共鉴定47658个片段-蛋白质的相互作用对,涉及2600多个蛋白质,其中86 %以前没有任何配体注释。
为了证明这些起点的转化潜力,作者将不同的FFF分别进行优化,并开发出了以下配体:(i) 与E3连接酶适配蛋白DDB1结合;(ii) 在功能上阻断人类平衡核苷转运体SLC29A1 (hENT1);或 (iii) 选择性抑制细胞周期蛋白依赖性激酶 (CDK) 子集,包括孤儿CDK16。
3
除了提高单个片段-蛋白质的命中率,作者还利用全球数据集的深度开发了一个ML框架,以建立模型预测片段如何在整个蛋白质组范围内与天然蛋白质相互作用。这一框架包括定量片段相互作用组的推断,这使作者能够预测特定片段将与多少蛋白质结合,以及结合的蛋白质本身是否具有广泛的化学可及性或对小分子配体具有典型的耐受性。
8
此外,ML模型使作者能够捕捉和预测定性的相互作用组特征。这使作者有可能研究和预测片段是否倾向于与具有共同功能的蛋白质子集(如转运体或RNA结合蛋白)发生相互作用。同样,ML模型让作者能够分析和预测片段是否倾向于与驻留在确定亚细胞定位或组成部分(如溶酶体或线粒体)中的蛋白质组发生相互作用,这可能表明细胞内片段的分配和积累。最后,作者还提供了一个平台来开发定制的 ML 模型,该模型基于用户定义的目标原蛋白输入,因此可以预测片段与一组定制原蛋白的结合。
综上所述,本文通过大规模化学蛋白质组学,系统鉴定了小分子片段与蛋白质之间的相互作用,并将这些数据应用于ML模型,以预测小分子与细胞中的蛋白质组相互作用。上述成果已在网站中(https://ligand-discovery.ai)公开发布,供人们探索。
本文作者:TZS
责任编辑:ZF
原文链接:https://www.science.org/doi/10.1126/science.adk5864
文章引用:10.1126/science.adk5864

weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0