image: 图1:模型框架图 view more
Credit: Copyright © 2025 Wenjie Du et al.
研究背景:在化学与生命科学的诸多关键问题中,分子间的相互作用关系极其复杂且难以捉摸。无论是溶质在溶剂中的溶解过程,药物之间潜在的不良反应,还是蛋白质复合体的结合机制,其本质都依赖于对分子间微观交互机制的精准建模。目前,主流的机器学习方法大多从三个方向建模分子间关系:一是基于编码拼接(将分子分别编码后简单连接),二是特征融合(通过注意力或融合模块整合分子特征),三是构建分子融合图(将溶质与溶剂原子统一在一个图中建模交互关系)。其中,分子融合图方法因其在原子层面上建模交互能力强、具备较好可解释性而受到广泛关注。代表性工作如 MMGNN,通过在融合图中构建原子间的无差别连接,并借助注意力机制筛选关键交互,提升了溶剂化自由能(ΔGsolv)预测的准确性。然而,其计算复杂度随分子规模显著增长,限制了模型的扩展性和通用性。
研究进展:针对这一问题,研究团队提出了全新的分子融合超图神经网络框架 MMHNN(Molecular Merged Hypergraph Neural Network)。该方法创新性地引入预定义子图集合,并将其替换为“超级节点”以构建超图结构,从而有效降低了模型复杂度。同时,为更精准地处理非交互性或排斥性原子对,MMHNN在融合图中引入图信息瓶颈(GIB)理论,以加强节点与边的语义解释能力,提升整体可解释性。
通过在多个溶质-溶剂数据集上的实验证明,MMHNN不仅在预测效率和性能上显著优于现有方法,还提供了更清晰的分子交互解释,为实现高效、可扩展的分子间关系建模提供了新路径。
此外,为了测试模型在不同的溶质溶剂体系下的模型的泛化能力,作者也对该模型在不同的溶剂体系和溶质骨架中,做了相关的泛化性分析,以验证模型的泛化性和有效性。
此外,针对不同溶质溶剂体系下模型的泛化性误差有着差异也进行了量化分析,发现模型对于较大分子的泛化误差收影响更大,而且针对不同的元素类型也有着一定的差异。同理的,对于溶质骨架,发现有着明显的分布差异,这意味着训练和测试导致的分布差异会影响模型性能。
最后,明显的是,基于分子融合超图神经网络框架的模型相较于全连接的分子融合图而言,时间消耗更少,内存占用更小,同时模型可以保证更好的性能。
原文链接:https://spj.science.org/doi/10.34133/research.0740
Journal
Research
Method of Research
News article
Subject of Research
Not applicable
Article Title
Molecular Merged Hypergraph Neural Network for Explainable Solvation Gibbs Free Energy Prediction
Article Publication Date
15-Aug-2025