2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。
混元Turbo S的设计灵感来源于人类日常决策中90%~95%依赖直觉的快思考模式,与理性分析的慢思考模式相结合,为大模型提供了更智能、高效的解决问题能力。通过长短思维链的融合,该模型不仅在文科问题上保持快速体验,还显著改进了理科推理能力,整体性能大幅提升。在业界通用的多个公开Benchmark测试中,混元Turbo S展现出与DeepSeek V3、GPT4o、Claude等领先模型相当的效果。
在架构创新方面,混元Turbo S采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,显著降低了训练和推理成本。这一混合架构突破了传统大模型在长文训练和推理成本高的难题,发挥了Mamba架构处理长序列的优势,同时保留了Transformer捕捉复杂上下文的能力,成为工业界首次成功将Mamba架构无损应用于超大型MoE模型的案例。
作为腾讯混元系列的核心基座,混元Turbo S未来将为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝全量上线,并将很快对外提供API接入服务。
目前,开发者和企业用户已可在腾讯云官网通过API调用混元Turbo S,并享受一周内免费试用的优惠。该模型的定价为输入0.8元/百万tokens,输出2元/百万tokens,相比前代混元Turbo模型大幅降价。此外,混元Turbo S也即将在腾讯元宝中逐步灰度上线,用户可在元宝内选择“Hunyuan”模型并关闭深度思考功能进行体验。
腾讯混元turbos模型API免费试用申请:https://cloud.tencent.com/apply/p/i2zophus2x8