Mistral 公司近日宣布升级其开源代码生成模型 Codestral,推出了全新版本 Codestral25.01。此次更新使得该模型在编程领域的竞争力显著增强,目标是为开发者提供更高效的代码生成体验。
根据 Mistral 的博客文章,Codestral25.01的架构经过优化,承诺在同类模型中成为 “绝对领军者”,其代码生成速度是之前版本的两倍。这一新版本依旧保持了原有模型的优势,专注于低延迟和高频操作,支持代码纠正、测试生成及代码填充等任务。Mistral 表示,这对于拥有大量数据的企业和模型驻留使用场景尤为重要。
在各项基准测试中,Codestral25.01在 Python 编码测试中表现优异,在 HumanEval 测试中取得了86.6% 的高分,超越了之前版本的 Codestral、Codellama70B Instruct 和 DeepSeek Coder33B Instruct。
开发者可以通过 Mistral 的 IDE 插件合作伙伴来使用 Codestral25.01。此外,用户还可以通过 Mistral 的平台和 Google Vertex AI 访问该模型的 API,目前该模型在 Azure AI Foundry 上提供预览,并将在 Amazon Bedrock 上上线。
自2023年5月首次发布 Codestral 以来,Mistral 便不断推动其产品的升级与创新。之前推出的 Codestral-Mamba 模型基于 Mamba 架构,能生成更长的代码字符串并处理更多输入。值得注意的是,Codestral25.01在 Mistral 发布公告后的几个小时内,就已迅速攀升至 C o p i l ot Arena 的排行榜上,显示出市场对这一新模型的强烈兴趣。
编写代码作为基础模型的早期功能之一,尽管在通用模型如 OpenAI 的 o3和 Anthropic 的 Claude 中也有应用,但在过去一年中,专注于编程的模型已经取得了显著进步,常常能超越一些大型通用模型。近期,阿里巴巴、DeepSeek Coder 和微软也相继发布了新的编程模型,竞争愈发激烈。
在众多开发者中,对于选择通用模型还是专注于编程的模型仍存在争议。有些开发者更倾向于使用像 Claude 这样的通用模型,而对于编程任务的需求则推动了专用模型的不断涌现。由于 Codestral 专门针对编码数据进行训练,因此在编程任务上的表现自然更为优异。
官方博客:https://mistral.ai/news/codestral-2501/
划重点:
🌟 Mistral 推出 Codestral25.01,代码生成速度提高至前版本的两倍。
💻 该模型在 Python 编码测试中表现优异,获得86.6% 的 HumanEval 测试分数。
📈 Codestral25.01迅速在 C o p i l o t Arena 中升至榜首,受到开发者广泛关注。