目前,生成式世界模型在模拟复杂环境时仍存在明显不足。以WorldPlay为代表的现有技术主要依赖像素级监督预训练,导致模型对多步骤指令的理解能力有限,在长距离漫游时容易出现画质下降和路径偏离问题。这些技术缺陷阻碍了虚拟交互场景的实际应用。
技术的价值在于解决实际问题。腾讯混元开源WorldCompass框架,将强化学习引入世界模型后训练此新兴领域,既突破了现有技术瓶颈,也说明了开放协作的精神。在生成式技术快速发展的今天,如何平衡模型能力与交互可靠性仍是行业需要持续探索的关键问题。这次开源或许只是一个开始。