Google Gemini 正式上线音乐生成功能,背后是 DeepMind 最新的 Lyria 3 模型 https://t.co/EtxHnbBhvn
2026 年 2 月 18 日,Google 在 Gemini 应用中上线了 AI 音乐生成功能,底层使用的是 Google DeepMind 开发的 Lyria 3 模型,目前以 Beta 形态面向全球 18 岁以上用户开放。用户只需用文字描述想要的音乐,或者上传一张照片、一段视频,Gemini 就能在几秒内生成一段 30 秒的完整音轨,包含人声、歌词和 AI 生成的封面图。
这意味着 Gemini 的创作能力从文本、图像、视频,正式延伸到了音乐领域。而考虑到 Gemini 应用目前月活用户超过 7.5 亿(Alphabet 最新财报数据),Lyria 3 一上线就直接拥有了 Suno、Udio 等专业 AI 音乐平台难以企及的用户基础。
Lyria 3 的三个核心升级
相比此前的 Lyria 模型,Lyria 3 有三项主要改进:
第一,自动生成歌词。以前用户需要自己提供歌词,现在只要描述主题和风格,模型会自动创作匹配的歌词。
第二,更精细的创作控制。用户可以指定风格、人声类型、节奏速度等音乐元素,而不仅仅是给一个笼统的描述。
第三,音乐质量和复杂度的提升。生成的音轨在乐器层次、人声真实感和音乐结构上都有明显进步。
两种使用方式
文字生成音乐:描述一个场景、情绪、风格甚至一个内部笑话,Gemini 就会据此生成一段完整音轨。比如"给我妈写一首欢快的 Afrobeat 歌曲,关于小时候她做的家常菜的回忆"。
图片/视频生成音乐:上传一张照片或一段视频,Gemini 会根据内容和氛围自动创作配乐。比如上传几张狗狗在森林里徒步的照片,它就能生成一首相关主题的歌曲。
每首生成的音轨都会配上由 Nano Banana 模型生成的封面图,可以直接下载或通过分享链接发给朋友。
与专业 AI 音乐工具的差异
目前 AI 音乐生成领域的头部玩家是 Suno(已迭代到 v5)和 Udio,两者都能生成完整的多分钟歌曲,提供 DAW 级别的编辑工具,支持分轨下载、混音和细粒度控制。相比之下,Lyria 3 在 Gemini 中的定位更偏向轻量化和娱乐化——Google 官方的说法是"目标不是创作音乐杰作,而是给你一种有趣、独特的自我表达方式"。
30 秒的时长限制也说明了这一点。Lyria 3 目前更适合社交分享、短视频配乐这类轻量场景,而不是正经的音乐创作。但它的优势在于零门槛——不需要额外注册任何服务,Gemini 用户直接就能用。
值得一提的是,Lyria 3 同时也接入了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成配乐,这一功能此前仅限美国,现在正向全球扩展。此外,开发者也可以通过 Vertex AI 的 API 使用 Lyria 模型(当前 API 版本为 lyria-002),支持以编程方式生成音乐。
版权和安全措施
AI 音乐生成在版权方面一直是敏感话题——Suno 和 Udio 在 2024 年都曾被三大唱片公司起诉,虽然 2025 年陆续达成了和解。Google 在这方面做了几层防护:
Lyria 3 被设计为用于"原创表达,而非模仿现有艺术家"。如果用户在提示中指定某位艺术家的名字,Gemini 只会将其作为风格上的宽泛灵感,而不会试图复制该艺术家的声音。同时,系统内置了过滤机制来检查输出是否与现有内容雷同。
所有生成的音轨都嵌入了 SynthID 水印,这是 Google 用于标识 AI 生成内容的不可见水印技术。Gemini 还新增了音频验证功能——用户可以上传一个音频文件,问 Gemini 它是否由 Google AI 生成,系统会检查 SynthID 并结合推理给出判断。这一验证能力此前只支持图像和视频,现在扩展到了音频。
使用信息
Lyria 3 目前在 Gemini 应用中以 Beta 形态提供,桌面端今天上线,移动端将在未来几天内陆续推出。支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,后续会扩展更多语言。所有 18 岁以上用户均可免费使用,Google AI Plus、Pro 和 Ultra 订阅用户享有更高的使用额度。
体验地址:https://t.co/4v2dzl6ibc
介绍:https://t.co/ZVwAdpODnf
Your browser does not support the video tag.