北大开源多模态AI新突破!VARGPT-v1.1视觉生成能力再升级
2025-04-15
北京大学团队推出多模态AI新版本VARGPT-v1.1,通过四大创新提升视觉自回归模型能力:迭代训练策略、分辨率扩展至512×512、使用830万条视觉指令数据及升级Qwen2语言模型。模型支持图像编辑且全面开源,实验显示其在视觉理解、生成及
任务中表现优异,但与商用模型仍有差距。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
