清华大学突破新药筛选瓶颈 AI驱动平台将筛选速度提升百万倍

问题——新药研发周期长、成本高,关键瓶颈之一在于“筛靶配对”效率。

针对特定疾病靶点寻找合适小分子,需要在海量候选分子中完成匹配与排序,既要速度,更要准确。

传统筛选依赖实验高通量与计算模拟相结合:实验筛选往往耗费时间与资源;基于分子对接等计算方法虽能降低部分成本,但通常需要逐步模拟结合过程,计算量大、扩展性受限,难以在更大范围内实现靶点全覆盖与快速迭代。

如何在保证可用性的前提下,将筛选从“点式探索”升级为“面式扫描”,成为新药研发亟待突破的现实课题。

原因——速度瓶颈的背后,是传统方法对“物理过程逐步计算”的高度依赖。

分子对接、动力学模拟等路径强调对结合构象和能量变化的细致刻画,精度固然重要,但计算开销随靶点数量、候选分子规模快速攀升。

尤其在面对多靶点、全基因组范围或突变位点增多的情况下,逐一模拟的思路难以适应大规模筛选需求。

此次清华大学团队发布的DrugCLIP提出了不同技术路线:将蛋白质与小分子转化为计算机可快速识别的“专属信号”,通过自动匹配实现快速筛选,从而绕开了逐步模拟结合过程带来的计算负担,形成“更可扩展”的筛选模式。

这一变化的核心,在于用更高效的信息表示与匹配机制,支撑更大规模的计算吞吐。

影响——筛选效率的大幅提升,有望重塑药物发现的组织方式与节奏。

据团队介绍,平台在普通高性能电脑上单日可完成31万亿次匹配计算,筛选100万个候选分子仅需0.02秒,速度较传统方法提升百万倍量级。

更重要的是,依托该平台,联合团队完成了人类基因组内约1万个靶点、2万个关键位点的全覆盖筛选,分析5亿余个候选小分子,富集200多万个潜在有效分子,进而建成全球规模最大的药物靶点匹配数据库并对外开放共享。

对科研界而言,这意味着药物筛选可以从“少量靶点、有限分子”的局部优化,进一步迈向“全景式靶点扫描与候选分子快速排序”,为药物再定位、靶点发现、突变位点相关药物探索等提供更丰富的数据基础和工具支撑。

对产业界而言,更快的筛选可能带来研发管线决策更及时、试错成本更可控,推动形成更高效的早研模式。

对策——让速度优势转化为真实创新效能,还需要配套的规范与协同机制。

一是以开放数据库为基础,推动跨机构的验证体系建设。

虚拟筛选解决的是“从海量到少量”的排序问题,后续仍需实验验证、药效评估与安全性评估。

建立标准化的验证流程与可追溯的数据记录,有助于提高结果可复现性与行业公信力。

二是强化与临床需求的对接,围绕重大疾病、罕见病以及抗感染、肿瘤、神经退行性疾病等领域,形成“需求牵引—筛选加速—验证闭环”的协作路径。

三是完善数据与模型治理框架,关注不同靶点类型、不同化学空间中的偏差与适用边界,持续评估平台在真实研发场景中的稳定性与泛化能力。

四是促进人才与算力资源的合理配置,通过共享平台降低中小团队的创新门槛,让基础研究成果更快转化为可用工具与可验证线索。

前景——从“百万倍提速”到“更快形成可用药物”,关键在于形成贯通的创新链条。

随着人类疾病谱、靶点库与化合物库持续扩张,药物研发将越来越依赖可扩展的筛选范式与高质量数据库。

基因组级靶点全覆盖筛选的实现,使得从靶点到候选分子的连接更加系统化,也为下一步将筛选与结构生物学、药代毒理预测、合成可行性评估等环节深度耦合提供了空间。

可以预期,未来药物发现将更加突出“数据驱动的全局搜索”与“实验验证的快速闭环”相结合:前者提升探索效率,后者保障科学可靠与临床可用。

开放共享的数据库若能在国际合作中持续更新迭代,也有望在全球药物创新生态中形成更强的公共基础设施效应。

这项具有里程碑意义的研究成果,展现了我国在生物医药与信息技术交叉领域的创新实力。

随着平台应用的不断拓展,未来有望催生更多原创性药物发现,为全球公共卫生事业贡献中国智慧。

科学界期待这一技术能早日转化为临床治疗突破,造福人类健康事业。