信息差

IBM发布Granite 3.2小型AI模型：高效推理与实用性并重

IBM 最近发布了其最新的 Granite3.2大型语言模型，旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力，还提升了灵活性和成本效益，使得用户更容易采用。

Granite3.2引入了视觉语言模型（VLM），用于处理文档，进行数据分类和提取。IBM 声称，这一新模型在一些关键基准测试中，性能达到或超过了更大型的模型，如 Llama3.211B 和 Pixtral12B。此外，Granite3.2的8B 模型在标准数学推理基准测试中，也显示出能匹敌或超越更大模型的能力。

为了提升推理能力，Granite3.2的某些模型还具备 “思维链” 功能，能够阐明中间推理步骤。该功能虽然需要较大的计算能力，但用户可以根据需求随时启用或禁用，以优化效率并降低整体成本。IBM AI 研究副总裁 Sriram Raghavan 在发布会上表示，下一代人工智能的重点在于效率、整合与实际影响，让企业在不超支的情况下实现强大的成果。

除了推理能力的提升，Granite3.2还推出了 “Granite Guardian” 安全模型的小型化版本，尽管体积缩减了30%，但性能仍然保持在前一代模型的水平。此外，IBM 还引入了一种名为 “可言语化信心” 的能力，这种能力能够更细致地评估风险，并在安全监测中考虑不确定性。

Granite3.2是在 IBM 的开源 Docling 工具包上训练的，该工具包允许开发者将文档转换为定制的企业 AI 模型所需的特定数据。模型训练过程中处理了8500万份 PDF 文件以及2600万个合成问答对，以增强 VLM 处理复杂文档工作流的能力。

IBM 还宣布推出下一代 TinyTimeMixers（TTM）模型，这是一种紧凑的预训练模型，专注于多变量时间序列预测，具备最长可达两年的长远预测能力。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

划重点:

📊 Granite3.2引入视觉语言模型，提升文档处理与数据提取能力。

💡 新模型具备思维链功能，能够阐明推理过程，增强推理能力。

🔍 Granit Guardian 安全模型小型化30%，但性能未受影响，同时推出可言语化信心的风险评估功能。

如果觉得文章对你有用，请随意赞赏

快讯

IBM发布Granite 3.2小型AI模型：高效推理与实用性并重

https://soraor.com/archives/ai-today_20250306110321

作者

破晓

发布于

2025-03-06

更新于

2025-03-06

许可协议

CC BY 4.0