苹果人工智能研究团队搞出了个大动静,他们弄出了一个叫LiTo的3D生成大模型,让做3D东西变得不那么难。用它你能直接把一张普通的二维图片变成一个逼真的3D模型,光影效果也好得很。这个新东西的亮点在于用了一种特别的数学编码方法,把那些复杂的表面光场数据变成了一些简单的向量集合。这么一来,不光能把物体的样子给抓出来,光线怎么和材料打交道也能弄得清清楚楚。LiTo用的是双向的编码器-解码器结构。编码器先把图片里的3D特征拿出来,像是形状还有材质;解码器再反过来用这些特征,把带有镜面反射、菲涅尔效应这类高级光学现象的模型给还原出来。这种设计保证了不管从哪个角度看,光影都能一直保持一致。为了训练这个模型,他们弄了几千个不同物体的扫描数据。实验结果显示,在摄像机角度对得准不准这点上,LiTo表现很出色,以前老出的方向弄错的问题这回基本没了。在光影一致性的比赛上,LiTo比那个叫TRELLIS的现有的最强对手还要强37%。这对咱们做3D内容的人来说是个大好事。它把做3D的门槛给降下来了,能给增强现实应用准备更多的素材。特别是在那种空间计算设备里,这种高质量的模型能让虚拟场景看着更真实、更让人沉浸进去。研究团队也说了,以后这技术还能用到更多工业上需要重建三维的地方去呢。