首尔国立大学研发突破性技术单张照片即可生成完整城市三维模型

（问题）智慧城市、城市更新、应急管理和文旅展示等场景中，对高精度、可交互的三维城市模型需求不断增加。但长期以来，城镇级三维建模主要依赖测绘采集、激光点云、倾斜摄影与人工建模等流程，成本高、周期长，也高度依赖专业人员和设备。另一上，大尺度场景的自动化生成仍受算力、数据与可扩展性限制：能生成单体建筑或小场景的方案并不少，但面对成片城区往往难以兼顾结构连续和细节一致。（原因）研究团队2026年3月发布的论文“Extend3D: Town-Scale 3D Generation”（arXiv:2603.29387v1）试图从技术路径上解决“大场景难生成”的关键矛盾：一是输入信息不足，单张图片天然存在遮挡与视角盲区；二是传统生成式模型多在固定尺度“画布”上工作，直接放大会带来纹理断裂、几何漂移和风格不统一；三是城镇级重建不仅要“像”，更要“连”，道路、建筑群、地形之间的几何关系需要自洽。为应对这些难点，研究提出“扩展潜在空间”的思路，将生成空间在水平与垂直方向扩展，并用重叠分块进行协同生成：把大范围区域切分为多个相互覆盖的小块，在局部生成的同时利用重叠区域施加连续约束，减少拼接痕迹，提升整体一致性。同时，方法引入单目深度估计，先从输入图像提取粗略点云或深度“骨架”，再在去噪生成过程中以较低扰动强度逐步完善与补全，从而在保留结构线索的基础上推断不可见部分。演示中，研究使用梵蒂冈城卫星图像生成三维城区效果，包含圣彼得大教堂等地标，并对遮挡区域进行了延展补全。（影响）业内人士认为，这个方向的价值不只在于“更快生成”，还可能重塑三维城市的生产链条：一是降低数字化门槛，让中小城市、园区乃至临时任务（如灾害评估、活动安保）更容易获得可用的三维底座；二是提升迭代效率，为城市规划推演、交通组织仿真、公共服务选址等提供更及时的空间表达；三是为影视、游戏、文旅导览等内容产业提供更低成本的场景资产来源，推动“所见即所得”的空间内容生产。同时也需看到，单张图像的推断补全存在不确定性，生成结果在几何精度、语义正确性与可验证性上仍有边界：推断出的背立面和遮挡街巷未必与真实一致，若直接用于测绘级应用或公共决策，可能带来误差风险。此外，卫星影像、航拍素材与街景图片涉及版权与隐私合规，技术扩散也可能引发新的治理议题。（对策）专家建议，推动此类技术走向工程化应用，需要同步建立规范体系：一是明确适用范围，将其定位为“快速建模与辅助表达”工具，并通过标注不确定区域、输出置信度等方式提示风险；二是建立统一评测与基准，围绕城镇尺度场景的结构连续性、道路拓扑正确性、建筑体量误差等形成量化指标；三是完善数据合规流程，强化影像来源审查、版权授权与敏感信息处理；四是推动与实测数据融合，关键区域用点云、倾斜摄影、地理信息数据进行校准与纠偏，形成“快速生成+精细校核”的组合路径。（前景）随着算力、生成式模型与空间感知算法持续演进，城镇级三维生成有望在更大范围实现更稳定的输出，并与“数字孪生城市”建设形成互补：日常以低成本快速更新保证“时效性”，重点区域以高精度测绘保障“真实性”。未来若能在多源数据融合、物理一致性约束、可解释性与可追溯性上取得突破，其应用边界有望从内容生产更扩展到城市治理的辅助工具层面，但前提仍是建立清晰的精度门槛与责任边界。

从一张鸟瞰图到一座可漫游的三维城市，技术进步正在压缩数字内容生产的时间与成本。但生成越快，越需要在真实性、可验证性与合规性上配套同等强度的约束。将新能力用于提升公共服务效率、促进文化传播与支持城市精细化治理，同时守住数据安全与应用边界，才是这类技术走向成熟与普及的关键。

首尔国立大学研发突破性技术 单张照片即可生成完整城市三维模型

首尔国立大学研发突破性技术单张照片即可生成完整城市三维模型