Meta 首席执行官马克・扎克伯格在近期的法律诉讼中,借助 YouTube 与盗版内容的斗争来为公司在 AI 训练中使用版权数据的做法辩护。此案名为 “Kadrey 诉 Meta”,是美国法庭中众多针对 AI 公司的版权诉讼之一,原告包括知名作家莎拉・西尔弗曼和塔 - 纳希西・科茨。
根据最近公布的扎克伯格证词摘录,他指出,尽管 YouTube 上可能会存在一部分盗版内容,但 YouTube 仍在努力将这些内容删除。“大多数在 YouTube 上的内容应该都是合法的,他们有相关许可。” 扎克伯格表示。这番言论暗示着他对 Meta 使用名为 LibGen 的版权电子书数据集进行 AI 训练的立场。
LibGen 是一个链接聚合网站,提供包括 Cengage Learning、麦格劳 - 希尔和皮尔逊教育在内的多个出版社的版权作品。该网站多次因版权侵权被起诉,并被罚款数千万美元。法庭文件显示,尽管 Meta 的 AI 团队对使用 LibGen 的法律风险表示担忧,扎克伯格却仍然批准了其用作训练数据集。
在审问中,扎克伯格声称自己对 LibGen 并不熟悉,但表示,禁止使用 YouTube 这样的平台将是不合理的。“不,我不会希望对人们使用 YouTube 设定政策,因为一些内容可能是受版权保护的。” 他说。他同时承认,Meta 在使用版权材料进行训练时需要谨慎。
根据原告律师的最新指控,Meta 曾将 LibGen 上的某些盗版书籍与可供授权的版权书籍进行交叉参考,以决定是否应该与出版商达成许可协议。此外,原告还指控 Meta 在训练其最新的 Llama 模型时使用了 LibGen 的数据集,并曾从另一个盗版源 Z-Library 下载电子书用于训练。
Z-Library 也因版权问题遭到多次法律行动,其维护者在2022年被控版权侵权、网络诈骗及洗钱等罪名。
划重点:
📚 扎克伯格在法庭上引用 YouTube 的案例为 Meta 在 AI 训练中使用版权材料辩护。
🔍 原告指控 Meta 使用盗版书籍数据集 LibGen 进行 Llama 模型的训练,并隐藏相关信息。
⚖️ Meta 面临多起版权诉讼,相关法律风险引发了内部讨论与关注。