日前,Google 推出了其最经济的模型 Gemini2.0Flash-Lite,并且正式可用于生产用途。Gemini2.0Flash-Lite 是 Google Gemini 系列的一部分,定位为成本效率最高的选择,该模型在 Google AI Studio 和 Vertex AI 上提供公共预览,目标是服务于需要高性价比 AI 解决方案的开发者。
它的设计强调轻量化,适合预算有限的团队和初创公司,特别是在处理大规模文本输出任务时表现出色。
定价是该模型的一大亮点Gemini2.0Flash-Lite 的输入 tokens 定价为每百万0.075美元,输出 tokens 为每百万0.30美元。这一定价策略使其在市场上具有竞争力,例如,与 OpenAI 的 GPT-4o-mini(输入0.15美元/百万,输出0.60美元/百万)相比,成本更低。
性能方面,该模型继承了 Gemini 系列的优点,上下文窗口达到100万 tokens,能够处理大量数据。它在大多数基准测试中优于 Gemini1.5Flash,保持相同的速度和成本,特别适合高频任务。
Gemini2.0Flash-Lite 支持多模态输入,但与2.0Flash 相比,不支持图像或音频输出,也没有“搜索作为工具”或“代码执行作为工具”等高级功能。这使其更专注于文本生成任务,适合需要快速、低成本解决方案的场景。它可以为约40,000张照片生成单行标题,成本不到1美元,显示其在实际应用中的高效性。
Google 的这一举动被视为对其 AI 战略的进一步扩展,特别是在与 OpenAI、Anthropic 等竞争对手的博弈中。