信息差

Mistral发布Codestral 25.01新一代编程模型，编程效率翻倍提升

Mistral 公司近日宣布升级其开源代码生成模型 Codestral，推出了全新版本 Codestral25.01。此次更新使得该模型在编程领域的竞争力显著增强，目标是为开发者提供更高效的代码生成体验。

根据 Mistral 的博客文章，Codestral25.01的架构经过优化，承诺在同类模型中成为 “绝对领军者”，其代码生成速度是之前版本的两倍。这一新版本依旧保持了原有模型的优势，专注于低延迟和高频操作，支持代码纠正、测试生成及代码填充等任务。Mistral 表示，这对于拥有大量数据的企业和模型驻留使用场景尤为重要。

在各项基准测试中，Codestral25.01在 Python 编码测试中表现优异，在 HumanEval 测试中取得了86.6% 的高分，超越了之前版本的 Codestral、Codellama70B Instruct 和 DeepSeek Coder33B Instruct。

开发者可以通过 Mistral 的 IDE 插件合作伙伴来使用 Codestral25.01。此外，用户还可以通过 Mistral 的平台和 Google Vertex AI 访问该模型的 API，目前该模型在 Azure AI Foundry 上提供预览，并将在 Amazon Bedrock 上上线。

自2023年5月首次发布 Codestral 以来，Mistral 便不断推动其产品的升级与创新。之前推出的 Codestral-Mamba 模型基于 Mamba 架构，能生成更长的代码字符串并处理更多输入。值得注意的是，Codestral25.01在 Mistral 发布公告后的几个小时内，就已迅速攀升至 C o p i l ot Arena 的排行榜上，显示出市场对这一新模型的强烈兴趣。

编写代码作为基础模型的早期功能之一，尽管在通用模型如 OpenAI 的 o3和 Anthropic 的 Claude 中也有应用，但在过去一年中，专注于编程的模型已经取得了显著进步，常常能超越一些大型通用模型。近期，阿里巴巴、DeepSeek Coder 和微软也相继发布了新的编程模型，竞争愈发激烈。

在众多开发者中，对于选择通用模型还是专注于编程的模型仍存在争议。有些开发者更倾向于使用像 Claude 这样的通用模型，而对于编程任务的需求则推动了专用模型的不断涌现。由于 Codestral 专门针对编码数据进行训练，因此在编程任务上的表现自然更为优异。

官方博客:https://mistral.ai/news/codestral-2501/

划重点:

🌟 Mistral 推出 Codestral25.01，代码生成速度提高至前版本的两倍。

💻 该模型在 Python 编码测试中表现优异，获得86.6% 的 HumanEval 测试分数。

📈 Codestral25.01迅速在 C o p i l o t Arena 中升至榜首，受到开发者广泛关注。

如果觉得文章对你有用，请随意赞赏

快讯

Mistral发布Codestral 25.01新一代编程模型，编程效率翻倍提升

https://soraor.com/archives/ai-today_20250114103911

作者

破晓

发布于

2025-01-14

更新于

2025-01-14

许可协议

CC BY 4.0