谷歌今日宣布推出全新升级的Gemini模型系列,包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。这次更新不仅大幅提升了性能,还带来了令人惊喜的价格优惠,无疑将在AI开发圈掀起一阵热潮。

首先,最吸引眼球的是价格的大幅下调。新版模型的使用成本直接腰斩,降幅超过50%。与此同时,性能却得到了显著提升。Gemini1.5Flash的处理速率翻倍,而1.5Pro更是接近三倍。这意味着开发者可以以更低的成本获得更快的输出和更短的延迟,大大提高了开发效率。

image

在性能方面,新版Gemini模型展现出全面的提升。特别是在数学、长文本处理和视觉任务上,进步尤为明显。例如,模型现在能够轻松处理超过1000页的PDF文档,回答包含上万行代码的问题,甚至能从一小时的视频中提取有用信息。在MMLU-Pro这个具有挑战性的基准测试中,新模型实现了约7%的性能提升。更令人瞩目的是,在MATH和HiddenMath基准测试中,提升幅度高达20%。

image

谷歌还对模型的响应质量进行了优化。新版本在保证内容安全的同时,提供了更有帮助、更简洁的回答。在总结、问答和信息提取等任务中,输出长度比之前缩短了5%到20%,这不仅提高了效率,也进一步降低了使用成本。

对于企业用户来说,Gemini1.5Pro的长文本处理能力(高达200万词)和多模态能力开启了全新的应用场景。从2024年10月1日起,输入令牌、输出令牌和增量缓存令牌的价格将分别降低64%、52%和64%,这无疑将大大降低企业使用AI的成本。

image

在使用限制方面,谷歌也做出了重大调整。Gemini1.5Flash的付费服务速率限制提高到每分钟2000次请求,1.5Pro则提高到1000次,这为开发者提供了更大的灵活性。

安全性一直是谷歌的重点关注领域。新版模型在遵循用户指令的同时,进一步增强了安全性。谷歌还调整了过滤器的默认设置,给予开发者更多自主权。

此外,谷歌还推出了改进版的Gemini1.5Flash-8B实验模型,在文本和多模态应用场景中表现出色。这个版本已经在Google AI Studio和Gemini API上发布,为开发者提供了更多选择。

对于Gemini Advanced用户,他们很快就能体验到专为聊天优化的Gemini1.5Pro-002版本。

参考资料:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/