正如我们在这个博客中探讨过的,人工智能在图像生成到写作等领域都取得了显著进展。然而,当涉及到创作真正能触动人心的音乐时,人工智能却面临着巨大的挑战。
尽管AI音乐生成器可以产出合格的旋律,但其作品往往感觉空洞,与定义音乐的独特人类体验脱节。YouTube 频道主 Adam Neely 在他的视频中分析了 AI 在音乐创作中面临的困境。
AI音乐的“硬伤”:缺乏情感与文化底蕴
其中一个主要障碍源于AI公司对音乐的理解。对许多开发者来说,音乐被视为一个需要通过算法优化的“问题”,而不是一种需要探索的艺术形式。这种思维方式剥夺了音乐的本质:其情感深度、历史根源和文化意义。
例如,AI生成的关于芝士汉堡的曲调,可能模仿了三角洲蓝调的结构,但这实际上是贬低了孕育这一流派的丰富历史。这种专注于“解决”音乐的做法,将其简化为一种模式复制的练习,失去了赋予音乐意义的意图。
图源备注:图片由AI生成,图片授权服务商Midjourney
AI音乐缺乏我们在艺术中本能地回应的“人性”。因为音乐与人类历史、激情和传统密不可分。然而,许多AI开发者的加速主义心态将技术进步置于理解音乐为何能感动我们之上。这种目光短浅导致了听起来精致但感觉虚假的音乐。缺乏共享的人性,AI作品就无法捕捉到音乐与个人和社会产生共鸣的难以言喻的特质。
AI面临的另一个重要障碍是,许多开发者对艺术过程缺乏兴趣。人类作曲家和表演者在做出选择时,不仅基于知识,还基于直觉、感觉和纯粹的突发奇想。他们会注入自发的、甚至是故意存在瑕疵的触动,以表达他们的个性。
而AI则通过分析和复制模式来运作。但它并不理解这些模式为何存在。例如,一个AI可能会根据其训练数据来扩展一个乐句或引入一个听起来正确的和声进行。但在没有适当的背景或意图的情况下,结果可能会感觉毫无灵魂。
艾伦·图灵在他1950年的论文中提出了模仿游戏,后来启发了图灵测试。他明白,要让机器展现出与人类相当的智能,就需要随机性和不可预测性。现代机器学习融入了这些元素,但单靠随机性并不能使音乐有意义。因为“随机性”表示缺乏理解。音乐不仅仅是意想不到的转折或新颖的组合,更重要的是创造情感连接。AI可以像其程序员所希望的那样模仿随机性或结构,但它不知道为什么应该这样做。
AI爱好者们即将认识到的教训是,文化不能简化为数据点。爵士乐、蓝调和古典音乐等流派的历史,与塑造它们的社会和个人背景密不可分。因此,AI生成的音乐常常显得平淡,因为它缺乏这种背景基础。它可以模仿一种流派的表面特征,但无法捕捉到赋予音乐灵魂的背景故事。
即使AI可以创作出与人类作品难以区分的音乐,也仍然无法解决更深层次的问题:意图。
音乐不仅仅是强加在毫无防备的空气分子上的声波。它是创作者和听众之间的一种沟通形式。AI生成的音乐缺乏人们在艺术中自然寻求的意图和情感连接。这种意图的缺失是为什么AI音乐(以及视觉艺术和小说),无论技术多么令人印象深刻,都常常感觉不完整的原因。
人类有能力重新诠释和重新定义音乐,甚至在他们最初不喜欢歌曲中找到意义。因为音乐邀请参与。这是一种人们积极参与的媒介,无论是通过跳舞、唱歌还是只是深入聆听。相比之下,AI音乐常常感觉是静态的,很少能让听众产生连接或重新诠释。
AI音乐的未来:辅助而非取代
AI生成的音乐在复制人类音乐的情感、文化和历史维度方面面临着巨大的障碍。虽然它可能在技术上成功地制作出精通的乐曲,但它缺乏意图、文化理解和特质,使其无法获得必要的人性触感。
也就是说,AI可以通过多种方式增强音乐,而无需取代人类的元素。当被合理使用时,AI可以成为艺术家的工具,在作曲或声音设计方面提供帮助,同时为创造力和情感表达留下空间。挑战在于确保AI是对音乐丰富传统的补充,而不是取代。
因为归根结底,音乐不仅仅是一连串的音符。它既反映了听众是谁,也为他们打开了一扇通往理想世界的大门。只要AI开发者将音乐视为一个需要解决的问题,而不是一种表达的媒介,AI生成的音乐就将仍然是合成的。