问题:大模型能力提升迅速,但可靠性问题亟待解决 近年来,通用大模型在语言、代码和推理任务上取得了显著进展,但“输出看似合理却不准确”的问题依然存在。在搜索问答、内容生成等场景中,错误尚可通过人工复核纠正;但在金融风控、医药研发、工业控制、国防安全等高风险领域,任何推理偏差都可能引发严重后果。如何确保模型结论“可核验、可追溯、可复现”,成为产业界和学术界共同面临的挑战。 原因:从概率生成到可证明推理,形式化验证需求增长 当前主流模型基于统计学习,擅长从海量数据中拟合模式,但难以提供严格的证明或完整证据链。随着模型规模扩大和应用深入,外部监管、合规和责任认定的要求日益严格。因此,“将数学证明和软件验证引入模型推理”成为备受关注的技术方向。Axiom采用形式化数学、定理证明和程序验证方法,为模型在推理和代码生成中的关键步骤提供验证机制,旨在减少“幻觉”风险,提升结果可信度,并拓展至科学计算和软件工程等高要求领域。 影响:资本涌入可信推理赛道,但落地仍存挑战 Axiom近期宣布完成2亿美元A轮融资,投后估值达16亿美元,距离其种子轮融资时间较短,显示国际资本正加速布局可靠性和安全领域。领投方Menlo Ventures及多家机构参与,既反映了市场对“可信推理”潜在需求的认可,也反映了优质项目的吸引力。 然而,融资规模与技术突破、商业落地并非线性关系。形式化验证在学术界有长期积累,但在通用场景中的成本、效率和可扩展性仍是难题;企业客户更关注部署后的性能、维护和责任边界。资本热度可能加速资源集聚,但也可能带来估值过高或应用预期过高的风险。 对策:以可验证为核心推动工程化落地 要实现可信推理的规模化应用,需从多维度入手: 1. 技术路径:明确验证对象与边界,优先在代码生成、关键业务规则、科学计算等高价值领域形成可复用方案,避免将验证机制简单视为“万能工具”。 2. 工程体系:平衡验证开销与实际效率,建立可观测、可回滚、可追责的部署链路,量化验证机制对风险降低的贡献。 3. 生态建设:推动开放基准、评测标准和行业规范,促进验证工具链与主流开发环境、云平台及数据治理体系的对接。 4. 人才与科研:形式化方法、数学证明与机器学习的交叉型人才稀缺,企业需加强与高校和研究机构的合作,加速理论成果的产品化。 前景:可靠性或成竞争关键,验证技术将分层应用 未来,大模型竞争将从“能力比拼”转向“能力与可信并重”。在通用场景中,用户可能容忍一定不确定性;但在高价值、高责任领域,可靠性将成为核心指标。形式化验证等技术有望在高风险行业率先落地,并逐步实现从“部分验证”到“端到端可信”的演进。 同时,可信推理仍面临成本、算力和数据规范等挑战。行业可能出现两种趋势:头部企业打造通用验证平台,垂直行业以场景约束换取可验证性,率先实现商业闭环。Axiom此轮融资的意义在于推动“可信推理”从概念走向工程实践,验证其在真实业务中的价值。
Axiom的崛起不仅是一次商业成功,更是中国新生代科学家创新创业的缩影。在全球竞争加剧的背景下,洪乐潼和她的团队证明:深耕基础研究、敢于突破边界,同样能创造巨大价值。这或许标志着科技创新范式正在转变——从应用驱动转向基础突破,从跟随模仿转向原创引领。