Google Magenta-realtime:人工智能现在可以生成歌曲
Magenta RealTime 是一种人工智能模型,可以根据您给出的指令即时生成音乐。这些指令可以采用文本描述(如“柔和的钢琴”或“欢快的鼓”)或模型可用于灵感的简短音频剪辑的形式。它的特别之处在于它是实时工作的。这意味着您可以在播放时更改声音或风格,它会在您播放时做出响应。这使得它非常适合现场表演、即兴演奏会或只是在家尝试新的音乐创意。洋红色 RT 也向所有人开放。谷歌已经发布了代码和模型权重
谷歌推出了一种名为 Magenta RealTime (Magenta RT) 的新音乐制作工具。这是一种新的 GenAI 模型,可帮助您在表演或探索新声音时现场创作音乐。无论您是音乐家、编码员,还是只是对创意人工智能感到好奇,Magenta RT 都开辟了一种与音乐实时交互的新方式。
我的新书《模型上下文协议:面向初学者的高级 AI 代理》已上线
模型上下文协议:面向初学者的高级 AI 代理(生成式 AI 书籍)
模型上下文协议:面向初学者的高级 AI 代理(生成式 AI 书籍)电子书:Gupta、Mehul、Sen、Niladri...
这是谷歌更广泛的洋红色项目的一部分,该项目多年来一直在开发工具,以利用人工智能支持人类创造力。与许多仅在付费应用程序或封闭系统后面可用的音乐工具不同,Magenta RT 是开源且免费使用的。
什么是洋红色实时?
Magenta RealTime 是一种人工智能模型,可以根据您给出的指令即时生成音乐。这些指令可以采用文本描述(如“柔和的钢琴”或“欢快的鼓”)或模型可用于灵感的简短音频剪辑的形式。
它的特别之处在于它是实时工作的。
这意味着您可以在播放时更改声音或风格,它会在您播放时做出响应。这使得它非常适合现场表演、即兴演奏会或只是在家尝试新的音乐创意。
洋红色 RT 也向所有人开放。谷歌已经发布了代码和模型权重,以便任何人都可以尝试它,在自己的项目中使用它,甚至进一步改进它。
是什么让它与众不同
Magenta RT 不仅仅是另一个根据文本提示创建歌曲的人工智能。它的设计更像是一种可以实时演奏和控制的乐器。
以下是它的与众不同之处:
- 交互式:您可以在播放时控制音乐的方向。不停地改变提示、混合风格并探索不同的音乐理念。
- 快速:它生成音乐的速度比实时快。每两秒的音乐,人工智能只需要大约 1.25 秒即可产生音乐。
- 灵活:您可以将不同的风格混合在一起,例如将爵士乐和电子音乐结合起来,或者在歌曲中途切换流派。
- 开放获取:该模型免费提供。您现在可以在 Google Colab 笔记本电脑中运行它,很快也可以在您自己的笔记本电脑或台式机上运行它。
这个怎么运作?
现场音乐生成是一个具有挑战性的问题,因为它需要快速且响应迅速。Magenta RT 通过处理简短的音频片段并不断更新自身来处理这个问题。
以下是其工作原理的基本解释:
- 它以两秒钟的片段(称为“块”)创建音乐。
- 它使用音乐的最后十秒来帮助决定接下来要播放的内容。
- 您可以给它一个风格提示——一段简短的音频或文本描述——来指导它制作什么样的音乐。
- 当您更新样式提示时,音乐会相应更改。
它听起来流畅清晰,产生高质量的立体声音频,可用于真实的表演或制作。
你可以用它做什么
洋红色 RT 为音乐家、艺术家和开发人员开辟了许多新的可能性。您可以做的一些事情包括:
- 无需知道如何演奏乐器即可创作自己的音乐
- 混合流派并发现新的声音组合
- 在现场表演时使用它来实时调整音乐
- 构建对声音做出响应的创意应用程序、游戏或装置
- 为视频或数字艺术制作独特的配乐
谷歌为什么要构建它
洋红色项目的目标一直是帮助人们利用人工智能更具创造力。Magenta RT 不是取代音乐家或作曲家,而是与他们一起工作,让更多人能够接触到音乐创作。
该团队希望制作一个工具,能够:
- 让音乐创作更轻松、更容易获得
- 鼓励创造性的探索和发现
- 让过程变得有趣、个性化并专注于当下
洋红色 RT 特别有用,因为它鼓励主动创造力,而不仅仅是被动内容生成。您始终保持控制。
它不能做什么(还)
与任何新工具一样,Magenta RT 也有一些限制:
- 没有真正的唱歌:它可以发出哼唱声或背景人声,但无法发出清晰的歌词或语音。
- 有限的音乐风格:它主要了解西方器乐,因此它可能在全球或声乐传统上表现不佳。
- 响应时间:由于它以两秒为单位工作,因此您的更改可能需要一两秒钟才能在音乐中生效。
- 记忆短:它只能记住音乐的最后十秒,因此它无法自行创建完整的歌曲结构。
如何尝试
入门很容易。以下是试用 Magenta RT 的方法:
- 使用 Colab 演示:Google 提供了一个即用型笔记本,您可以在浏览器中免费运行。
- 下载模型:如果您更懂技术,可以从 Hugging Face 或 Google Cloud 获取模型权重并在本地运行它们。
- 探索代码:GitHub 上提供了所有内容,因此开发人员和研究人员可以构建自己的应用程序或调整模型。
GitHub:https://github.com/magentamusic/magenta-rt
在 Colab 中试用:https://colab.research.google.com/
从Hugging Face下载:https://huggingface.co/
洋红色项目网站:Magenta
最后的思考
Magenta RealTime 是利用人工智能支持音乐创作向前迈出的令人兴奋的一步。它使人们能够让音乐变得现场,在当下塑造它,并以一种互动和有益的方式探索新的声音。
通过保持该模型的开放性并可供所有人使用,谷歌正在邀请音乐家、程序员、艺术家和业余爱好者成为下一代创意工具的一部分。
这不是要取代艺术家,而是要扩大他们的能力。
更多推荐

所有评论(0)