信息差

Meta 高层全力追赶 GPT-4，训练数据遭遇版权争议！

近日，随着一起关于人工智能版权的案件 ——Kadrey 诉 Meta 案的进展，Meta 公司内部的消息被法庭解封，透露出公司高管在开发 Llama3过程中，执着于超越 OpenAI 的 GPT-4模型。

Meta 的生成 AI 副总裁阿赫马德・阿尔 - 达赫（Ahmad Al-Dahle）在2023年10月的一条信息中提到:“老实说，我们的目标必须是 GPT-4。我们有64000个 GPU!我们需要学习如何建设前沿技术，赢得这场竞争。”

尽管 Meta 发布开放的 AI 模型，但公司的 AI 领导层显然更关注那些不公开模型权重的竞争对手，比如 Anthropic 和 OpenAI，并将它们的 Claude 和 GPT-4视为工作标准。尽管法国 AI 初创公司 Mistral 被多次提及，但 Meta 高管对其评价显得颇为轻视。阿尔 - 达赫在信息中表示:“Mistral 对我们来说就是小菜一碟，我们应该能够做得更好。”

在 AI 领域，各大公司争相推出先进的 AI 模型，而这些法庭文件显示了 Meta 在这场竞争中的高度紧张氛围。在多条信息中，Meta 的 AI领导者提到他们在获取训练 Llama 所需数据方面 “非常积极”。一位高管甚至表示:“Llama3是我唯一关心的事情。” 他们讨论了如何改进数据集，以提升 Llama3的表现。

然而，案件的检察官指控 Meta 高管在急于推出 AI 模型的过程中，可能在数据使用上有所疏漏，涉及到了一些受版权保护的书籍。Touvron 提到，Llama2的数据集组合 “效果不佳”，并探讨了如何使用更好的数据源来提升 Llama3。阿尔 - 达赫询问道:“我们有合适的数据集吗?有没有什么因为愚蠢的原因无法使用的内容?”

Meta 首席执行官马克・扎克伯格此前曾表示，努力缩小 Llama 模型与 OpenAI、谷歌等公司闭源模型之间的性能差距。这些内部消息显示，Meta 在追求这一目标上承受着巨大的压力。扎克伯格在2024年7月的一封信中提到:“今年，Llama3在最先进的模型中具备竞争力，并在某些领域领先。”

2024年4月，Meta 最终发布了 Llama3，这一开放 AI 模型在竞争中表现出色，超过了来自 Mistral 的开放选项，但其训练模型使用的数据 —— 这些数据据称得到了扎克伯格的批准，正面临多个诉讼的审查。

划重点:

🌟 Meta 高管在开发 Llama3过程中专注于超越 OpenAI 的 GPT-4模型。

💡 该公司在获取数据方面表现积极，但面临使用版权受限数据的指控。

📈 扎克伯格期待未来的 Llama 模型能够成为行业中最先进的选择。

如果觉得文章对你有用，请随意赞赏

快讯

Meta 高层全力追赶 GPT-4，训练数据遭遇版权争议！

https://soraor.com/archives/ai-today_20250115134215

作者

破晓

发布于

2025-01-15

更新于

2025-01-15

许可协议

CC BY 4.0