信息差

重磅！智谱开源GLM-32B模型性能直逼Deepseek R1-671B，同时官宣启动IPO

智谱宣布全面开源其新一代大语言模型 GLM 系列，涵盖以下三款核心模型：

推理模型 GLM-Z1-Air
沉思模型 GLM-Z1-Rumination
基座模型 GLM-4-Air-0414

基础模型 GLM-4-32B 以 320 亿参数量比肩更大参数量的国内外主流模型。GLM-4-32B 强化了代码生成能力，可以生成更为复杂的单文件代码。
GLM-Z1-Air-32B 是具有深度思考能力的推理模型，在部分任务的性能表现上，在仅使用 32B 参数的情况下，可与参数高达 6710 亿的 DeepSeek-R1 相媲美。
推理模型GLM-Z1-Air/AirX-0414不仅性能比肩DeepSeek-R1 等世界一流推理模型，模型推理速度还可以做到最高 200 Tokens/秒

所有模型均遵循 MIT 开源协议，可商用、无需申请、完全开放权重与部署方式

GLM-Z1-Air —— 国内最快的推理模型，性能比肩 DeepSeek-R1

关键词：320亿参数、极速推理、推理能力优化、开放式任务适配

AIME 24/25、GPQA、LiveCodeBench 等多个任务中表现接近 DeepSeek-R1（671B）

仅用 32B 参数达到 671B 模型的水平，展现高度优化的推理结构

📌 关键参数与能力：

参数规模：32B
对标模型：DeepSeek-R1（671B），在部分推理任务上性能相当甚至超越
测试指标：在 AIME 2024、LiveCodeBench、GPQA 等基准任务上取得优异表现
推理速度：
- 标准版：约 50 tokens/s
- 极速版 AirX：最高可达 200 tokens/s
- 相比 DeepSeek-R1，推理速度最高提升达 8 倍

速度对比

🔧 技术优化细节：

使用 强化数据微调 + 深度对齐机制，特别加强数学/逻辑/代码类能力
推理框架进行深度优化：
- GQA 架构 + KV Cache 显存利用最小化，提升并发效率
- 量化方案、投机采样技术改进推理速度
- 适配推理调度平台调度粒度，降低吞吐瓶颈

✅ 应用场景：

数学/逻辑问答类任务（如考试、作业、流程设计）
高并发推理需求平台，如问答机器人、大模型笔试系统、搜索问答引擎
低延迟交互式智能体，如AIGC协作助手、教育推理模型

GLM-Z1-Rumination —— 下一代沉思模型，面向开放式复杂推理任务

关键词：自主思考、动态验证、强化学习、Deep Research

📌 模型定位：

能解决不确定性、多解性、高复杂度问题
构建“提问—搜索—推理—验证—输出”完整链条
可进行 工具调用 + 搜索引擎整合 + 深度生成分析

🧠 技术特点：

end-to-end 强化学习（RL）训练管线，跨越搜索、思考、反馈验证全过程
模型可调用工具（如搜索引擎、代码运行器、文献数据库）
内建“反思—总结—修正”链式推理流程，避免信息孤岛、单路径思维局限
与人类研究者类比：如“AI 博士生”，可以处理需要检索、归纳、逻辑论证的长任务

示例场景：

科研写作、市场调研、政策评估等开放问题生成任务
多文档摘要、真伪验证、跨源知识对比任务
支持通过 Z.ai 平台体验，或部署至企业级智能体平台

GLM-4-Air-0414 —— 强行动能力的基础模型，支持多任务智能体建设

关键词：基础能力、工具调用优化、智能体能力增强、代码能力强化

GLM-4-Air-0414：高性能工具智能体基础
GLM-4-Flash-250414：免费调用基础模型版本

🌟 技术亮点：

预训练使用 15T 多源高质量数据，强化逻辑、代码与推理能力
强调指令跟随、函数调用、代码生成与 Artifacts 操作
后训练融合 拒绝采样 + 强化学习 技术，提升任务完成准确性与泛化能力

📈 性能表现：

在工程代码、工具调用、搜索问答方面表现优异
与 GPT-4o、DeepSeek-V3（671B）部分任务表现持平
HTML/CSS/JS/SVG 代码生成可实时预览，支持交互修改（已接入 z.ai）

💻 编程交互能力：

原生支持 HTML、CSS、JavaScript、SVG 等前端语言的实时代码生成与运行展示
可部署于代码生成平台、AIGC 设计辅助系统、低代码工具中

⚙️ 模块与接口：

与工具接口原生兼容，适合智能搜索、插件化助手、企业工具链集成
支持大模型原生开发 Agent 系统，形成完整**“感知—思考—行动”链**

🧪 示例任务：

用 HTML 模拟太阳系运动
用 SVG 展示 LLM 训练流程
用 JS 实现小游戏（如2048）

z.ai 上线

智谱全新站点 z.ai正式启用！该平台集成了对话、推理与沉思三类 GLM 模型，自今日起全面向全球用户免费开放使用。覆盖从文本生成、深度问答到多轮对话的智能场景，帮助用户快速进行智能问答、信息检索与研究任务。

z.ai目前已上线三款开源模型：

GLM-4-32B（对话模型）：具备强大代码生成能力，支持全新 Artifacts 功能，打造交互式开发体验
Z1-32B（推理模型）：超强推理性能，在线体验最高达 200 Tokens/秒 的极速输出
Z1-Rumination-32B（沉思模型）：驱动 Deep Research 能力的强大模型，免费开放

同时智谱宣布开始A股IPO...成为第一家正式启动IPO的大模型创业公司

如何使用

【开源模型】 32B 基础模型、32B 推理模型、32B 沉思模型（裸模型）

【配置要求】

1 张 H100 / A100 或者更先进的NVIDIA旗舰显卡

4 张 4090 / 5090 / 3090

【在线体验】

MaaS平台：32B 基础模型、 32B 推理模型的极速版和高性价比版

z.ai：32B 基础模型、32B 推理模型、基于 32B 沉思模型的完整 Deep Research 功能

如果觉得文章对你有用，请随意赞赏

快讯

重磅！智谱开源GLM-32B模型性能直逼Deepseek R1-671B，同时官宣启动IPO

https://soraor.com/archives/ai-today_20250415121716

作者

破晓

发布于

2025-04-15

更新于

2025-04-15

许可协议

CC BY 4.0