苹果人工智能研究团队搞出了个大动静，他们弄出了一个叫lito的3d 生成大模型，让做3d 东西变得不

苹果人工智能研究团队搞出了个大动静，他们弄出了一个叫LiTo的3D生成大模型，让做3D东西变得不那么难。用它你能直接把一张普通的二维图片变成一个逼真的3D模型，光影效果也好得很。这个新东西的亮点在于用了一种特别的数学编码方法，把那些复杂的表面光场数据变成了一些简单的向量集合。这么一来，不光能把物体的样子给抓出来，光线怎么和材料打交道也能弄得清清楚楚。LiTo用的是双向的编码器-解码器结构。编码器先把图片里的3D特征拿出来，像是形状还有材质；解码器再反过来用这些特征，把带有镜面反射、菲涅尔效应这类高级光学现象的模型给还原出来。这种设计保证了不管从哪个角度看，光影都能一直保持一致。为了训练这个模型，他们弄了几千个不同物体的扫描数据。实验结果显示，在摄像机角度对得准不准这点上，LiTo表现很出色，以前老出的方向弄错的问题这回基本没了。在光影一致性的比赛上，LiTo比那个叫TRELLIS的现有的最强对手还要强37%。这对咱们做3D内容的人来说是个大好事。它把做3D的门槛给降下来了，能给增强现实应用准备更多的素材。特别是在那种空间计算设备里，这种高质量的模型能让虚拟场景看着更真实、更让人沉浸进去。研究团队也说了，以后这技术还能用到更多工业上需要重建三维的地方去呢。