清华大学突破新药筛选瓶颈 AI驱动平台将筛选速度提升百万倍

问题——新药研发周期长、成本高，关键瓶颈之一在于“筛靶配对”效率。

针对特定疾病靶点寻找合适小分子，需要在海量候选分子中完成匹配与排序，既要速度，更要准确。

传统筛选依赖实验高通量与计算模拟相结合：实验筛选往往耗费时间与资源；基于分子对接等计算方法虽能降低部分成本，但通常需要逐步模拟结合过程，计算量大、扩展性受限，难以在更大范围内实现靶点全覆盖与快速迭代。

如何在保证可用性的前提下，将筛选从“点式探索”升级为“面式扫描”，成为新药研发亟待突破的现实课题。

原因——速度瓶颈的背后，是传统方法对“物理过程逐步计算”的高度依赖。

分子对接、动力学模拟等路径强调对结合构象和能量变化的细致刻画，精度固然重要，但计算开销随靶点数量、候选分子规模快速攀升。

尤其在面对多靶点、全基因组范围或突变位点增多的情况下，逐一模拟的思路难以适应大规模筛选需求。

此次清华大学团队发布的DrugCLIP提出了不同技术路线：将蛋白质与小分子转化为计算机可快速识别的“专属信号”，通过自动匹配实现快速筛选，从而绕开了逐步模拟结合过程带来的计算负担，形成“更可扩展”的筛选模式。

这一变化的核心，在于用更高效的信息表示与匹配机制，支撑更大规模的计算吞吐。

影响——筛选效率的大幅提升，有望重塑药物发现的组织方式与节奏。

据团队介绍，平台在普通高性能电脑上单日可完成31万亿次匹配计算，筛选100万个候选分子仅需0.02秒，速度较传统方法提升百万倍量级。

更重要的是，依托该平台，联合团队完成了人类基因组内约1万个靶点、2万个关键位点的全覆盖筛选，分析5亿余个候选小分子，富集200多万个潜在有效分子，进而建成全球规模最大的药物靶点匹配数据库并对外开放共享。

对科研界而言，这意味着药物筛选可以从“少量靶点、有限分子”的局部优化，进一步迈向“全景式靶点扫描与候选分子快速排序”，为药物再定位、靶点发现、突变位点相关药物探索等提供更丰富的数据基础和工具支撑。

对产业界而言，更快的筛选可能带来研发管线决策更及时、试错成本更可控，推动形成更高效的早研模式。

对策——让速度优势转化为真实创新效能，还需要配套的规范与协同机制。

一是以开放数据库为基础，推动跨机构的验证体系建设。

虚拟筛选解决的是“从海量到少量”的排序问题，后续仍需实验验证、药效评估与安全性评估。

建立标准化的验证流程与可追溯的数据记录，有助于提高结果可复现性与行业公信力。

二是强化与临床需求的对接，围绕重大疾病、罕见病以及抗感染、肿瘤、神经退行性疾病等领域，形成“需求牵引—筛选加速—验证闭环”的协作路径。

三是完善数据与模型治理框架，关注不同靶点类型、不同化学空间中的偏差与适用边界，持续评估平台在真实研发场景中的稳定性与泛化能力。

四是促进人才与算力资源的合理配置，通过共享平台降低中小团队的创新门槛，让基础研究成果更快转化为可用工具与可验证线索。

前景——从“百万倍提速”到“更快形成可用药物”，关键在于形成贯通的创新链条。

随着人类疾病谱、靶点库与化合物库持续扩张，药物研发将越来越依赖可扩展的筛选范式与高质量数据库。

基因组级靶点全覆盖筛选的实现，使得从靶点到候选分子的连接更加系统化，也为下一步将筛选与结构生物学、药代毒理预测、合成可行性评估等环节深度耦合提供了空间。

可以预期，未来药物发现将更加突出“数据驱动的全局搜索”与“实验验证的快速闭环”相结合：前者提升探索效率，后者保障科学可靠与临床可用。

开放共享的数据库若能在国际合作中持续更新迭代，也有望在全球药物创新生态中形成更强的公共基础设施效应。

这项具有里程碑意义的研究成果，展现了我国在生物医药与信息技术交叉领域的创新实力。

随着平台应用的不断拓展，未来有望催生更多原创性药物发现，为全球公共卫生事业贡献中国智慧。

科学界期待这一技术能早日转化为临床治疗突破，造福人类健康事业。