AI时空智能大考不及格,多模态模型集体翻车
2025-04-15
上海交通大学联合多机构推出STI-Bench评测基准,测试多模态大模型在时空智能领域的表现。结果显示,包括Gemini、GPT-4o、Claude、Qwen等顶尖模型在空间距离计算、动态运动分析等任务中准确率不足42%,远低于实际应用需求。研究指出模型在定量空间属性、时间动态理解和跨模态整合三大核心瓶颈,暴露多模态AI在自动驾驶、具身智能等场景中的技术短板。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表 官方立场,不构成投资建议。如需阅读详细说明,请点击此处
