谷歌 Deepmind 推出 Lyria AI 音频模型，可生成带有乐器和人声的音乐

吴厣人工智能 2024-11-26 582

感谢小猪号网友 Coje_He 的线索投递！

小猪号 11 月 21 日消息，Deepmind 日前推出了一款名为 Lyria 的音频模型，可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作，整合 Lyria 模型开发了音乐创作工具 Dream Track，声称可令视频创作者“更有效率地将想法变为作品”。

研究人员介绍了当前通过 AI 模型生成音乐的挑战，这是因为音乐本身包含极高的信息密度，其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较于“生成语言（文字转语音）”更为复杂，而对于 AI 模型来说，维持长音乐序列中的连续性也更为困难，这是因为模型需要在不同的乐句、诗节和长段落中，保持音乐的流畅性和一致性。

此外，由于音乐片段中经常同时包含多个声部和乐器，这也进一步增加了音乐生成的难度，相关音频模型必须能够协调多种声音和旋律，从而使生成的音乐更自然。

而 Deepmind 所开发的 Lyria AI 模型，便是针对上述痛点进行的尝试，这款模型的最大特点就是能够生成包含乐器和人声的高品质音乐。

谷歌 Deepmind 推出 Lyria AI 音频模型，可生成带有乐器和人声的音乐-第1张图片-小猪号

▲ 图源 Deepmind

此外，Lyria 模型还擅长进行音乐变换和延续的任务，因此模型还能基于现有音乐片段生成出风格新颖或统一的后续片段。

研究人员同时强调，Lyria 模型拥有细致的微调选项，可让用户精确生成音乐风格及表现方式，因此这款模型可以“满足专业音乐创作的需求，同时也可以让业余用户轻松上手”。

谷歌 Deepmind 推出 Lyria AI 音频模型，可生成带有乐器和人声的音乐-第2张图片-小猪号

▲ 图源 Deepmind

小猪号注意到，目前 YouTube 已经在短视频功能“Shorts”中应用 Lyria 模型，相关成果已经集成在 YouTube 的实验音乐创作工具 Dream Track 中，用户可以用这款工具生成多样化的配乐，并可选用 Charlie Puth、Charli XCX、Sia 等艺术家的音乐风格来创造出“全新演绎”。

谷歌 Deepmind 推出 Lyria AI 音频模型，可生成带有乐器和人声的音乐-第3张图片-小猪号