上海交大发布光学领域垂直大模型 专业小模型超越通用巨型模型开启新路径

(问题)在新一轮科技革命与产业变革背景下,通用模型能力不断增强,但在光学等“硬科技”领域,仍面临知识门槛高、公式与物理约束强、工程流程复杂等挑战。

光学研究与应用往往涉及精密计算、严谨推导与实验验证,既要理解物理机理,也要熟悉工程设计逻辑。

若缺乏专业知识体系与可验证的推理链条,容易出现“看似合理、实则偏离物理”的结论,限制其在科研与产业关键环节的落地。

(原因)为解决“通用而不精”的痛点,上海交通大学“光生未来”项目组推出光学垂直大模型Optics GPT,强调从光通信、光学设计等核心领域的专业数据与设计方法中系统学习,构建更贴近光学学科范式的知识结构。

项目负责人、上海交通大学教授义理林介绍,该模型为完全自主研发,规模为80亿参数量级,突出轻部署、高认知、强应用、全可控等特点:一方面支持端侧与边缘高效部署,降低应用门槛;另一方面通过结构化注入专业知识,强化对关键概念、典型器件与常见工程流程的理解,同时在数据构建、训练到部署运行等环节保持自主可控,以更好兼顾产业安全与数据隐私需求。

(影响)围绕专业能力的客观检验,团队构建覆盖光物理、光量子、光学设计、非线性光学、光计算与光通信等方向的评测集,并与多款主流通用模型及开源模型开展对比测试。

结果显示,Optics GPT在多项核心维度取得领先表现。

业内解读认为,这一结果释放出清晰信号:在专业化、结构化训练路径下,“小而专”的模型同样可能在垂直领域形成优势,进而为科研与工程提供更稳定、更可控的工具供给。

这不仅拓宽了模型研发的技术路线,也为硬科技领域的数字化、智能化升级提供了新的基础设施选项。

(对策)在应用层面,Optics GPT被定位为面向教学、科研与产业三类场景的综合型工具。

在教学方面,模型可将抽象概念与复杂公式转化为可视化演示与互动问答,辅助生成案例、虚拟实验与练习,提升课堂组织效率与学习体验,有望推动光学课程从“概念讲授”向“问题驱动、交互验证”转变。

在科研方面,模型可作为研究助手,帮助梳理文献脉络、启发方案设想、辅助完成模拟计算并提出实验思路,从而缩短从理论推演到实验验证的周期。

面向工程与产业链环节,模型则聚焦关键流程的智能化支撑:在国产高端仪器领域,通过智能交互与流程辅助提升设备使用体验;在数据中心光互连等基础设施场景,辅助故障诊断与运维决策,并提升光模块出厂标定效率与精度;在激光制造领域,推动核心器件向参数自优化、状态预测与故障自动运维方向演进。

(前景)从更宏观的视角看,光学是信息通信、先进制造、精密测量与新型计算等领域的重要底座。

随着产业对可靠性、效率与成本约束的提升,能够兼顾专业深度与部署成本的垂直模型,有望在更多真实场景中形成规模化应用。

但也应看到,硬科技领域的模型落地,需要与仿真软件、实验平台、行业标准和工程数据闭环协同推进,特别是在可验证计算、误差边界控制以及安全合规使用方面,应建立更细化的评测体系与应用规范。

未来,若能持续完善专业数据体系、强化与实验/仿真工具链的联动,并在行业场景中迭代验证,垂直模型将更可能成为支撑科研范式创新与产业升级的“新型基础设施”。

在全球科技博弈向基础学科纵深发展的背景下,此次突破不仅填补了光学智能工具的空白,更探索出一条硬科技与智能化深度融合的中国路径。

当技术创新从"大而全"转向"专而精",我们或许正在见证科研范式变革的关键转折——唯有深耕专业沃土,方能培育出支撑高质量发展的创新生态。