mova和seedance2.0 最大的不同在于完全开源

2023年2月，复旦大学就发布了类ChatGPT的对话模型MOSS，两个月后便彻底开源。邱锡鹏团队给出了开源模型的“答卷”，MOSS成为了国内首个支持搜索、画图、计算等插件的开源对话模型。MOVA是这个月上海创智学院联合模思智能推出的作品，邱锡鹏教授作为项目负责人，接受了解放日报记者的独家专访。就在这次采访中，邱锡鹏提到了一个关键点：MOVA和Seedance2.0最大的不同在于完全开源。国内的音视频生成模型大多不对外提供文件下载，也不允许本地部署，这种封闭式的策略无法吸引更多人参与研究。为了推动技术普惠，邱锡鹏决定让MOVA彻底敞开大门。他不仅把360p、720p两个基础模型全部开源出来，还开放了微调、推理和生成工作流等全链路组件。这就意味着用户可以用MOVA做动漫或者游戏时按自己的需求进行二次开发。邱锡鹏解释说，这种完全开源的做法是为了构建一个开放社区，让更多人能参与进来。而Seedance2.0走的是商用路线，投入了大量工业级资源。这两家模型在单段生成效果上确实有差别：MOVA能支持最长8秒的720p视频，Seedance2.0则能达到15秒的2K高清画质。从效果来看，用户会感受到一种身临其境的真实感。相比Seedance2.0这种偏商业的风格，“学院派”的MOVA在特色上有所不同。邱锡鹏坦言做音视频模型非常难，因为数据规模远超文本。过去在学术界几乎是不可能完成的任务，算法层面缺乏借鉴，数据工程能力也不是高校的强项。好在上海创智学院倡导“研创学”融合的育人文化，让学生能深度参与重大项目快速成长。模思智能作为企业依托自身优势解决了数据工程难题。这一次发布也体现了邱锡鹏团队一贯的开源精神。Seedance2.0引发了马斯克在社交平台X上的评论“发展速度太快了”。复旦大学计算与智能创新学院教授邱锡鹏把自己和团队定位成挑战者的角色。