近年来,随着人工智能(AI)技术的迅速发展,“开放” 人工智能的概念备受关注。然而,一项最新的研究表明,关于 “开放” 人工智能的宣传实际上可能误导公众和政策制定者,形成对行业集中化的错误认知。该研究由康奈尔大学的博士后研究员大卫・威德尔(David Widder)撰写,并发表于《自然》杂志。
图源备注:图片由AI生成,图片授权服务商Midjourney
研究指出,许多关于 “开放” 人工智能的说法缺乏准确性,往往只关注 AI 系统开发到部署生命周期的某一阶段,而忽视了在大规模 AI 开发和部署中,行业集中度所带来的重大影响。研究将 “开放” 人工智能与自由和开源软件进行了比较,探讨了 IBM 与 Linux、谷歌与 Android、亚马逊与 MongoDB 以及 Meta 与 PyTorch 的关系。
研究指出,虽然开源软件在某种程度上促进了软件开发的民主化,确保了代码的完整性与安全性,但 “开放” 人工智能却并不具备相同的特性。强大的技术公司正在利用 “开放” AI 的说法来塑造政策,声称它要么促进创新与民主,要么对安全造成威胁。因此,在政策制定时,清晰的定义至关重要。
此外,研究分析了 AI 的本质及 “开放性” 的含义,探讨了模型、数据、劳动力、框架和计算能力等方面。虽然 “开放” AI 系统可以提供透明性、可重用性和可扩展性,但 Meta 的 LLaMA-3模型却被指出缺乏真正的开放性,因为它仅提供 API 或受限制的模型下载,这种情况被称为 “开放洗白”。
在对比中,EleutherAI 的 Pythia 被认为是最开放的 AI 模型,提供了源代码、训练数据和完整的文档,并以与开放源代码倡议一致的条款进行许可。然而,尽管 AI 领域的开放性有所进展,但技术巨头的市场优势依然显著,因为构建大型模型所需的数据、开发时间和计算能力仍然是市场准入的巨大障碍。
研究结论强调,单靠 “开放” AI 无法实现更具多样性、问责制或民主化的行业环境。大公司在追求 AI 优势时,常常利用 “开放” AI 来巩固市场地位,从而掩盖其垄断行为。因此,为了实现更公平的市场环境,还需要采取反垄断执法和数据隐私保护等其他措施。研究者最终指出,单纯寄希望于 “开放” AI 并不足以改变现状,反而可能会在企业集中化的背景下使问题更加复杂。
划重点:
🧩 研究显示,关于 “开放” AI 的宣传常常模糊定义,误导公众对行业集中化的认知。
🔍 “开放” AI 与开源软件的运作机制不同,许多大型技术公司利用这一概念维护自身利益。
⚖️ 实现 AI 行业的多样性和公平竞争需要更多措施,如反垄断执法和数据隐私保护。