信息差

新研究揭秘：AI模型潜在能力凸显，具备超越标准提示的学习潜力

近期，一项新的研究方法揭示了 AI 模型在学习过程中潜在的能力，超出了人们之前的预期。研究人员通过分析 AI 模型在 “概念空间” 中的学习动态，发现了如何让 AI 系统更好地理解和生成图像。

图源备注:图片由AI生成，图片授权服务商Midjourney

“概念空间” 是一种抽象的坐标系统，能够表示训练数据中每个独立概念的特点，比如物体的形状、颜色或大小。研究者表示，通过在这个空间中描述学习动态，可以揭示出概念学习的速度，以及学习顺序受数据属性的影响，这一属性被称为 “概念信号”。这个概念信号反映了数据生成过程对概念值变化的敏感度。例如，当数据集中红色和蓝色之间的差异明显时，模型对颜色的学习速度会更快。

在研究过程中，研究团队观察到模型的学习动态会出现突然的方向变化，从 “概念记忆” 转向 “泛化”。为了验证这一现象，他们训练了一个模型，输入了 “大的红色圆圈”、“大的蓝色圆圈” 和 “小的红色圆圈”。在训练中未出现的 “蓝色小圆圈” 组合，模型无法通过简单文本提示生成。但是，使用 “潜在干预” 技术（即操控模型中负责颜色和大小的激活）和 “过度提示” 技术(即通过 RGB 值增强颜色规格)，研究者成功生成了 “蓝色小圆圈”。这表明，尽管模型能够理解 “蓝色” 和 “小” 的组合，但它并未通过简单的文本提示掌握这一能力。

研究人员还将这一方法扩展到实际数据集，例如 CelebA，它包含多种面部图像属性如性别和微笑。结果显示，模型在生成微笑女性图像时表现出隐藏能力，而在使用基本提示时则显得乏力。此外，初步实验还发现，使用 Stable Diffusion1.4时，过度提示可以生成不寻常的图像，如三角形的信用卡。

因此，研究团队提出了一种关于隐藏能力的普遍假设:生成模型具备潜在能力，这些能力在训练过程中突然且一致地出现，尽管模型在面对普通提示时可能不会表现出这些能力。

划重点:

🌟 AI 模型在学习过程中展现出潜在的隐藏能力，超出了常规提示所能激发的水平。

🔍 通过 “潜在干预” 和 “过度提示” 等技术，研究人员能够激活这些隐藏能力，生成意想不到的图像。

📊 研究分析了 “概念空间” 的学习动态，表明不同概念的学习速度受数据特征的影响。

如果觉得文章对你有用，请随意赞赏

快讯

新研究揭秘：AI模型潜在能力凸显，具备超越标准提示的学习潜力

https://soraor.com/archives/ai-today_20241120102343

作者

破晓

发布于

2024-11-20

更新于

2024-11-20

许可协议

CC BY 4.0