. 李文金课题组在《Journal of Chemical Information and Modeling》发表研究论文:具有偏差感知的靶点特异性评分函数AttentionScore-深圳大学高等研究院
loading..
首页   >   新闻动态   >   学术成果   >  

正文

李文金课题组在《Journal of Chemical Information and Modeling》发表研究论文:具有偏差感知的靶点特异性评分函数AttentionScore

2025-12-27

2025年12月23日,李文金团队在《Journal of Chemical Information and Modeling》上发表了题为 “AttentionScore: A Target-Specific, Bias-Aware Scoring Function for Structure-Based Virtual Screening: A Case Study on METTL3”的研究工作,提出了一个面向 METTL3 的靶标特异性、偏差感知(bias-aware)的深度学习评分函数 AttentionScore。李文金研究员为通讯作者,课题组博士后Muhammad Junaid为第一作者。

尽管基于结构的虚拟筛选(SBVS)已成为早期药物发现的重要工具,但通用评分函数往往存在“泛化弱、偏差强”的问题,尤其在训练集与测试集相似度较高时容易产生“类比泄漏(analogue leakage)”,导致对真实外推能力的高估。为此,该研究将配体本身信息与蛋白–配体相互作用信息统一纳入端到端架构:模型采用多头注意力编码器与联合自编码式潜在表征,并通过多尺度融合模块耦合PLEC相互作用指纹与配体指纹(Avalon/ECFP4),以同时捕获“相互作用模式”和“化学骨架/基团特征”。

图1. AttentionScore框架:将配体指纹与蛋白–配体相互作用指纹分别输入多头注意力编码器构成的并行分支提取分层潜表示,并在多尺度层面融合后交由全连接层进一步表征优化,最终输出用于虚拟筛选的分类评分结果。

在评估策略上,文章强调“偏差可控”的对比更关键。这项工作构建了基于 ECFP4 Tanimoto聚类的相似度约束(SC)划分(阈值τ = 0.50),并进一步定义了更严格的外推测试集(Set 2:测试分子与所有训练分子相似度 ≤ 0.50),系统比较随机划分、scaffold 划分与 SC 划分的差异;同时通过 ECFP4 与 PLEC 的跨集合相似性诊断、阈值敏感性分析,验证SC协议能显著降低泄漏风险。

在关键结果方面,AttentionScore在SC测试集(Set 1)取得PR-AUC = 0.9609、Precision = 0.9698、Recall = 0.7277、F1 = 0.8057、MCC = 0.7388,并在更严格的Set 2上仍保持强性能,整体优于通用评分函数与多种机器学习基线;配套的配对Wilcoxon检验、bootstrap置信区间与效应量分析也支持提升具有统计稳健性,而非“划分偶然性”

这项工作提供了数据、代码,并向非专业用户的图形界面,为“可复现、可落地”的靶标特异性虚拟筛选提供了更透明的技术路径。

该研究得到了广东省自然科学基金和深圳市科技创新局的支持。

原文链接:https://pubs.acs.org/doi/10.1021/acs.jcim.5c02142?ref=pdf

地址:深圳市南山区白石路3883号深圳大学粤海校区致知楼703学院办公室 518060

联系电话:0755-26492572

版权所有 © 深圳大学高等研究院