我一直对音乐 AI 持怀疑态度——直到我真正使用它
快速阅读: 据《The Conversation (英国)》最新报道,人工智能在音乐创作中的应用引发争议,但其辅助作用不可忽视。通过与AI合作,音乐创作者可以探索新风格并提升技能,但需保持创作主导权。音乐的魅力在于不完美,人类的独特性仍无可替代。
如今能够生成整首歌曲的人工智能程序已经问世,你或许会觉得人工智能最终可能导致人类创作音乐的衰落。但人工智能仍然可以在道德框架下帮助人类音乐家挑战自我并提升音乐创作能力。我本应清楚这一点。作为一名作曲家兼音乐教育者,在我开始接触这项技术之前,我一直对人工智能持怀疑态度。
**两种观点**
如果你能编写文本提示,就能用人工智能在任意流派中生成轨道,适用于几乎任何音乐用途。除了生成完整的轨道之外,音乐人工智能还可以用于声音分析、噪声去除、混音和母带处理,以及创建整个声音调色板(例如用于视频游戏和播客)。Suno、Beatoven、AIVA、Soundraw 和 Udio 是目前在人工智能音乐领域处于领先地位的一些公司。在很多情况下,输出无需完美,只要够用就好,这足以降低真实音乐家和声音设计师的服务成本。
音乐行业有这样的担忧是可以理解的。2024年4月,美国艺术家权利联盟发表了一封公开信,超过200位艺术家联署,呼吁开发者停止用受版权保护的作品训练他们的AI,因为这会让公司模仿艺术家的音乐和形象,进而减少支付给艺术家的版税。同时,音乐人工智能公司宣称降低了制作音乐的门槛,例如通过消除对物理设备和传统音乐教育的需求。在1月份的一次采访中,Suno首席执行官迈克·舒尔曼说:“这不是我想传递给学生的理念。”然而,遗憾的是,这反映出音乐家们在快节奏世界中的压力。
**从怀疑者到不情愿的支持者**
2023年,我受悉尼歌剧院之邀,与本地设计公司Kopi Su合作创作新作品,并在此过程中开发一款新的生成式音乐人工智能工具。这款名为Koup Music的工具正在测试阶段。我接受了这次机会——但心存诸多疑虑,因为我对与人工智能合作毫无兴趣。这岂不是白白浪费时间?还是我的数据会被添加到某些神秘的人工智能数据池?或者它是否会为我开辟新的创意方向?
该工具基于一个名为Riffusion的文本到图像扩散模型。它接受一个文本提示并生成一个光谱图,这是音频信号中各种频率随时间变化的视觉表示。然后将其转换为音频。首先,我会将自己的录音样本上传到人工智能,然后选择一个文本提示将其转换成一个新的五秒样本。例如,我可以上传一段简短的声乐旋律并要求人工智能将其变成昆虫,或重新将其置于“嘻哈”风格中。有时生成的样本听起来非常像我的声音(由于我上传的声乐部分)。以下昆虫声音输出成为了下面音乐作品的主题。介于人声和昆虫之间。
在项目进行时,输出只能是5秒或10秒长——不够制作完整轨道。我认为这是一个积极的因素,因为它意味着我必须将这些样本融入到自己的更大作品中。一些样本很吸引人。一些很有趣。另一些则很无聊。有些带有粗糙、刺耳的音色。这一切的不完美给了我乐趣的许可。我专注于使用文本提示生成独立的音乐元素,而不是完全排列好的样本。一个生成的鼓点或旋律线足以激发一种全新的音乐风格,这是我原本不会尝试的。这个输出被用于《事物如何成长》这首歌中。
有时,一个生成的样本就已足够。其他时候,我会挑战自己仅用人工智能生成的声音完成整首曲目。在这种情况下,我会运用滤波、循环小段等手法提取所需声音。例如,我使用以下片段创作了下面的曲目:
这些片段被用于《嘭嘭嘭》这首歌中。这一过程如同合作——仿佛我在与一位怪异的同伴共创音乐。这让制作‘完美’音乐的压力得以缓解,而是让我专注于新的创意方向。
**我的收获**
我得出结论,了解大型音乐人工智能的能力并非坏事。我们可以借助它们提升自身的音乐理解力,比如研究它们如何运用风格潮流和混音技巧,或将音乐理念转化为不同类型的音乐。对我来说,消除对人工智能的疑虑关键在于使用不会掌控整个工作流程的人工智能。我灵活接受它的建议,同时凭借自身知识保持创作主导权。
我的经历并非孤例。多项研究表明,音乐人工智能用户反馈,那些能让使用者在创作中保留掌控感的程序令人满意。这些项目的共通之处在于,人工智能并未一次性生成完整音乐作品,而是生成有限的音乐信息,比如节奏、旋律或和弦,由用户决定最终成果。
**人类不完美的美丽**
尽管舒尔曼声称,与音乐人工智能建立有意义关系的关键在于与其协作,而非让它包办一切。我认为每位音乐学生都应将人工智能融入日常练习吗?不。但在合适条件下,它可提供工具产出真正有创意的内容。创作‘不完美’的艺术需耗费时间和精力,这是身为人类的代价。对此我深表感激。
(以上内容均由Ai生成)