阿里通义再下一城!超逼真多模态AI模型开源引爆数字人赛道
2025-04-15
阿里通义实验室推出全新多模态AI模型OmniTalker,可基于参考视频生成高度逼真的数字人音视频,支持文本驱动同步生成语音与面部动态,技术上采用双分支DiT架构实现跨模态融合,实验显示其在音视频同步性、风格一致性及实时性方面达到SOTA水平。该模型已开源且提供免费体验,可显著降低数字人制作成本,推动虚拟主播、客服等场景应用落地。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
