信息差

Mistral AI发布首款开源推理模型Magistral，Flash Answers模式推理速度惊人

Mistral AI 宣布推出其首个专注推理的语言模型 Magistral，旨在解决当前主流 LLM 在以下方面的不足：

Magistral 试图构建一个“能像人类一样思考”的 AI——具有结构化、可验证、逐步推理的能力，同时支持多语言使用。

模型版本

Magistral Small：24B 参数的开源版本（Apache 2.0协议），可在 Hugging Face 上下载。
Magistral Medium：功能更强大的企业版本，可通过 Le Chat、La Plateforme API、Amazon SageMaker 访问，未来将上线 IBM WatsonX、Azure AI 和 Google Cloud。

多数投票（majority voting @64）是通过多个生成版本得出最一致答案，表示在多样性与一致性之间平衡的能力。

Medium 模型达到 90% 的准确率，接近顶级闭源模型 GPT-4 Turbo 的水平，尤其在专业任务中表现突出。

核心技术与架构亮点

1. 🧩 Chain-of-Thought 原生支持

Magistral 原生支持链式思维（CoT），并能自动生成可解释的思维链条。这对于复杂任务（如法律推理、系统规划）尤其关键。

推理优化设计（Reasoning-Oriented）

2. 🌍 多语言高保真推理

模型具备多语言推理能力，特别优化了以下语言：

→ 关键点：不仅支持多语言输入/输出，而且推理链条也能在目标语言中自然生成。

3. ⚡ Flash Answers + Think Mode（仅限企业版）

通过“Le Chat”平台，Magistral Medium 可开启：

4. 🔍 推理透明性与可追溯性

每一个生成结果都附带清晰的“思考轨迹”，可以追踪、审计。特别适合监管行业（法律、金融、医疗等）。

模型已开源，支持商业用途。
量化后可运行在单张 RTX 4090 或 MacBook M2（32GB）上。
提供多个平台支持，包括：
- vLLM（推荐）
- llama.cpp 版本（GGUF）
- 支持 lmstudio、ollama、unsloth、Axolotl 等工具链

Chat 模板（推荐使用）

使用默认的系统提示词（system prompt）可获得最佳推理效果：

[SYSTEM_PROMPT] 你应该先展示思考过程（inner monologue），再给出一个清晰的答案总结。你的回答必须使用与用户相同的语言。请使用 Markdown 格式输出。

如果觉得文章对你有用，请随意赞赏

快讯

Mistral AI发布首款开源推理模型Magistral，Flash Answers模式推理速度惊人

破晓

2025-06-16

2025-06-16

CC BY 4.0