近日,位于杭州的 AI 公司 DeepSeek 发布了其最新的大型语言模型 ——V3。这款开源模型在多项基准测试中的表现接近于 OpenAI 的4o 和 Anthropic 的 Claude3.5Sonnet,这让业界刮目相看。与美国同行动辄数亿美元的投资相比,DeepSeek 的 V3模型总成本仅为560万美元,这一巨大的差异让人瞩目。
图源备注:图片由AI生成,图片授权服务商Midjourney
DeepSeek 的首席执行官梁文峰表示,资金从来不是他们面临的问题,尽管 V3是基于 H800芯片训练的,但 DeepSeek 的团队依然能够在资源有限的情况下展现出强大的研究与工程能力。
AI 领域的先驱 Andrej Karpathy 对此评价道,DeepSeek 的投资预算 “真是个笑话”,然而最终呈现的成果却是 “在资源约束下的高度令人印象深刻的研究与工程”。
AGI 被视为 AI 研究的 “圣杯”,能够在解决问题和执行任务上超越人类,相关专家预测,一旦技术成熟,首个实现 AGI 的国家将在经济、科学和安全上占据巨大的优势。