信息差

语音操控新境界！理想汽车MindVLA大模型实测视频震撼发布

快科技3月21日消息，今天下午，理想汽车详细介绍了MindVLA大模型与现有端到端 VLM大模型的区别，并公布了相关实测视频。

按能力表现来看，MindVLA 模型加持下的汽车就像一个助手，能与用户沟通、理解用户意图，帮用户做更多事情。

比如，它可以在陌生车库漫游找车位直至自主完成泊车；

可以按照驾驶员的开快点、开慢点、左拐、右拐”等语音指令进行行动；

可以在你发给它地标照片后，按图索骥找到你等等。

理想汽车还表示，MindVLA是理想汽车下一代自动驾驶核心架构，使用了MindGPT作为语言基座，demo中的语音通过座舱的ASR后变成文字，输入给 MindVLA。

这一设计继承自 MindGPT 在语言理解与交互领域的优势能力（如语义解析、逻辑推理等），并针对自动驾驶场景进行了专项优化。

这体现了智舱与智驾在功能层的协同创新，而非系统层的完全融合。

未来，我们将持续探索多模态交互与驾驶决策的深度耦合，为用户提供更自然的人车共驾”体验。

如果觉得文章对你有用，请随意赞赏

快讯

语音操控新境界！理想汽车MindVLA大模型实测视频震撼发布

破晓

2025-03-21

2025-03-21

CC BY 4.0