近日,随着一起关于人工智能版权的案件 ——Kadrey 诉 Meta 案的进展,Meta 公司内部的消息被法庭解封,透露出公司高管在开发 Llama3过程中,执着于超越 OpenAI 的 GPT-4模型。

Meta 的生成 AI 副总裁阿赫马德・阿尔 - 达赫(Ahmad Al-Dahle)在2023年10月的一条信息中提到:“老实说,我们的目标必须是 GPT-4。我们有64000个 GPU!我们需要学习如何建设前沿技术,赢得这场竞争。”

image

尽管 Meta 发布开放的 AI 模型,但公司的 AI 领导层显然更关注那些不公开模型权重的竞争对手,比如 Anthropic 和 OpenAI,并将它们的 Claude 和 GPT-4视为工作标准。尽管法国 AI 初创公司 Mistral 被多次提及,但 Meta 高管对其评价显得颇为轻视。阿尔 - 达赫在信息中表示:“Mistral 对我们来说就是小菜一碟,我们应该能够做得更好。”

在 AI 领域,各大公司争相推出先进的 AI 模型,而这些法庭文件显示了 Meta 在这场竞争中的高度紧张氛围。在多条信息中,Meta 的 AI领导者提到他们在获取训练 Llama 所需数据方面 “非常积极”。一位高管甚至表示:“Llama3是我唯一关心的事情。” 他们讨论了如何改进数据集,以提升 Llama3的表现。

然而,案件的检察官指控 Meta 高管在急于推出 AI 模型的过程中,可能在数据使用上有所疏漏,涉及到了一些受版权保护的书籍。Touvron 提到,Llama2的数据集组合 “效果不佳”,并探讨了如何使用更好的数据源来提升 Llama3。阿尔 - 达赫询问道:“我们有合适的数据集吗?有没有什么因为愚蠢的原因无法使用的内容?”

Meta 首席执行官马克・扎克伯格此前曾表示,努力缩小 Llama 模型与 OpenAI、谷歌等公司闭源模型之间的性能差距。这些内部消息显示,Meta 在追求这一目标上承受着巨大的压力。扎克伯格在2024年7月的一封信中提到:“今年,Llama3在最先进的模型中具备竞争力,并在某些领域领先。”

2024年4月,Meta 最终发布了 Llama3,这一开放 AI 模型在竞争中表现出色,超过了来自 Mistral 的开放选项,但其训练模型使用的数据 —— 这些数据据称得到了扎克伯格的批准,正面临多个诉讼的审查。

划重点:

🌟 Meta 高管在开发 Llama3过程中专注于超越 OpenAI 的 GPT-4模型。

💡 该公司在获取数据方面表现积极,但面临使用版权受限数据的指控。

📈 扎克伯格期待未来的 Llama 模型能够成为行业中最先进的选择。