问题——随着大模型应用从试点走向规模化落地,数据系统面临新的工程挑战;一方面,企业智能问答、知识检索、业务助理等场景中既需要语义检索、向量相似度计算等能力,也要兼顾结构化过滤、事务一致性与低时延响应;另一上,权限控制、可追溯与数据治理等要求同步提升,目标不只是“能回答”,更要“答得准、跑得快、用得稳”。此背景下,如何构建面向智能应用的高效数据底座,成为产业界与高校共同关注的关键议题。 原因——技术演进与工程约束叠加,推动数据库能力边界外延。传统做法多采用“搜索引擎+数据库”的拼接架构:外部检索系统负责召回,数据库完成结构化查询与业务处理。但在真实生产环境中,这种组合常带来链路变长、系统复杂度上升以及一致性维护成本增加等问题,难以同时满足低延迟、强一致与可治理的综合目标。,向量检索、混合查询以及多模态数据处理需求快速增长,推动数据库从单一存储与事务处理平台,向兼具检索、分析与智能应用支撑能力的一体化基础软件演进。人才培养也随之从“会用数据库”走向“能做数据库、能做优化、能做工程落地”。 影响——赛事成为观察数据库与智能融合趋势的窗口,也在加速复合型人才储备。本届大赛吸引全国高校1223支队伍、2620名学生参赛,经过两个多月比拼,北邮“编程高手”队凭借数据库内核优化与AI应用开发的综合表现夺得冠军。赛事自2021年发起,2023年纳入全国大学生计算机系统能力大赛体系,属于教育部认定的A类学科竞赛。五年来累计覆盖500余所高校、超过1.1万名学生,逐步形成面向数据库核心技术的人才培养链条。业内人士认为,这类以真实工程约束为导向的竞赛,有助于学生在系统设计、性能调优与应用落地之间建立更完整的认知,也为国产基础软件生态建设和产业人才供给储备力量。 对策——以“实战项目+开源平台+递进赛制”对接产业需求,打通底层能力与工程化能力。本届大赛采用“初赛+决赛”模式:初赛以实战项目MiniOB为载体,要求参赛者从零实现数据库核心模块并集成向量检索功能,重点考察系统原理、模块设计与基础实现能力;决赛首次引入Apache 2.0许可的开源AI原生数据库OceanBase seekdb,设置“内核优化”和“AI应用开发”两道赛题,分别对应智能应用落地中“性能效率”和“稳定治理”的核心诉求,聚焦“Data×AI”融合中的关键工程难点。北京科技大学计算机与通信工程学院院长殷绪成表示,面向智能时代的数据库人才培养,应推动“智能技术与数据库深度融合”:一上用智能方法提升数据库性能,另一方面建设面向训练与应用的高效数据基础设施,并通过真实工程任务促使学生从“使用工具”迈向“构建系统、优化系统”。 前景——从竞赛走向产业,AI原生数据库或将成为新一轮基础软件竞争的重要方向。当前我国在互联网与智能数据库涉及的领域已积累较强技术基础,开源生态活跃度持续提升。面向未来,随着智能应用深入深入政务、金融、制造、教育等行业,数据系统将更强调一体化、可治理与可扩展;原生支持混合查询、多模态检索并兼顾一致性与安全性的数据库产品,有望获得更广泛应用。同时,基础软件竞争最终取决于工程能力、生态能力与人才供给能力的综合实力。以赛事为牵引,将产业问题转化为教学与训练场景,持续培养既懂底层系统又懂智能工程落地的复合型人才,将为我国基础软件高质量发展提供更坚实支撑。
从实验室到产业界,从技术追随到生态引领,这场持续五年的数据库竞赛折射出我国数字技术人才培养的深层变化;在AI浪潮重塑全球技术竞争格局之际,以学科竞赛为纽带的教育创新实践正在培育破解“卡脖子”难题的后备力量。未来,如何把赛事沉淀的经验转化为常态化培养机制,或将成为推动关键领域人才梯队建设的重要命题。