AI音乐军备竞赛:Udio,音乐领域的ChatGPT

Suno 的新对手 Udio 来势汹汹,背后有科技和音乐巨头支持。它拥有强大的功能——以及一个奇怪的习惯,那就是复活汤姆·佩蒂

译自 AI-Music Arms Race: Meet Udio, the Other ChatGPT for Music,作者 Brian Hiatt。

就在去年,许多专家认为能够根据文本提示生成完整、高保真歌曲的AI 模型不会很快出现,但现在,一场军备竞赛正在由能够做到这一点的竞争性音乐制作模型之间展开。Suno 的 v3 模型于几周前向公众发布,是一个非凡的突破,尤其是在逼真的、听起来像人类的声音方面——而今天,一个强大的新竞争对手通过刚刚推出的初创公司 Udio 出现。这两家公司的输出似乎非常接近,尽管一些早期用户表示,平均而言,Udio 的输出听起来可能比 Suno 的更清晰,机器制作的痕迹更少,不会有声音模糊的问题。

Udio 的产品在去年 12 月由谷歌人工智能研究部门 DeepMind 的四名前员工——David Ding, Conor Durkan, Charlie Nash, Yaroslav Ganin 以及 Andrew Sanchez 共同创立后,以惊人的速度问世。他们得到了包括 a16z(又名 Andreesen Horowitz)和 Instagram 联合创始人兼首席技术官 Mike Krieger 在内的一系列科技巨头的支持。“从我们获得投资的那天起,我们就得到了很好的支持,”Sanchez 说。“因此,技术联合创始人能够迅速投入工作,因为我们可以很快地完成所有工作。”

Udio 的早期投资者名单中也有一些著名的音乐人,包括 Common、制作人 Tay Keith、行业资深人士 Steve Stoute 的 United Masters 和 Will.i.am。在一篇新闻稿中,长期以来一直是 AI 音乐可能性 传道者的 Will.i.am 对该公司的产品赞不绝口:“这是一个全新的文艺复兴,而 Udio 是这个时代创造力的工具,”这位在产品开发过程中提供咨询的艺术家说。“有了 Udio,你可以通过 AI 和你的想象力创造出歌曲。”

尽管两家公司都不会直接证实或否认,但有充分的理由相信 Udio 和 Suno 都在未经许可的情况下接受了受版权保护的音乐的训练,这种做法最近在 Artists Rights Alliance 的一封公开信中遭到谴责,该信由从 Stevie Wonder 到 Billie Eilish 的艺术家签署。该组织在给滚石的一份新声明中重申了其立场。“未经艺术家同意、授权和补偿就使用艺术家的作品不仅不道德、不负责任,而且会破坏文化馈赠,而且是非法的,”Artists Rights Alliance 执行董事詹·雅各布森说。(受版权保护的材料是否可以合法地用于训练 AI 的问题目前正在各种法庭案件中审理。)“Artists Rights Alliance 敦促 AI 平台放弃这条鲁莽的道路,如果他们未能做到这一点,我们敦促权利持有人采取迅速的法律行动来阻止他们。”

滚石使用 Udio 的预发布测试版时,该服务在一天内制作了两首独立的歌曲,显然使用了与已故汤姆·佩蒂 的声音几乎无法区分的声音。“我们确实有一个过滤器来检测声音听起来与某些现有艺术家过于相似的情况,”联合创始人丁说。“当然,这个过滤器并不完美。它也是一个 AI 系统,我们将继续对其进行迭代。但这绝对不是我们的本意。”(无法联系到佩蒂遗产的发言人置评。)然而,Udio 可能有未来计划更正式地提供声音克隆——该公司的新闻稿提到了一个即将出台的计划,旨在让艺术家“对自己的声音肖像拥有财务控制权”。

与专注于将音乐制作工具交到普通消费者手中的 Suno 不同,Udio 也将自己视为音乐家的工具。其创始人表示,其沿此方向的创造能力应能缓解创作者对其使用训练数据所产生的担忧。“我们从一开始就受到音乐人士的指导,”桑切斯说,“这意味着我们正在制作一款产品,它将使这些人能够创作出伟大的音乐,并且明确地说,将来可以靠这些音乐赚钱。”桑切斯强调了他相信该公司的产出是“变革性的”——换句话说,该模型正在利用其训练数据创造一些新的东西,ChatGPT 也在当前的版权材料使用法庭案件中使用这一论点。

滚石使用 Suno 的 v3 创作的一首 AI 蓝调歌曲上个月爆红;上面是 Udio 的竞品。我们使用了提示“关于悲伤的 AI 的独奏原声密西西比三角洲蓝调”——与 Suno 一样,Udio 通过 API 调用 OpenAI 的 ChatGPT 来编写歌词,除非您提供自己的歌词。我们还要求 Suno 和 Udio 制作彼此的 diss 曲目;以下是这些结果。

Suno 目前根据其提示生成两分钟长的音乐片段。Udio 更具可定制性,但使用起来可能也不那么直观,它从 30 秒的片段开始,可以根据用户的规格进行扩展。该公司已经私下向音乐家提供了更多细粒度的控制,联合创始人 Sanchez 表示,任何对该公司感到担忧的创作者都应该联系他们。“我们开业了,”他说。“给我们打电话。我们很乐意交谈,我们会让您参与进来,然后您会看到,‘哦,哇。这实际上很酷。我现在不再害怕它了,因为我觉得我已经掌握了它。’”

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注