找回密码
 立即注册
查看: 681|回复: 0

谷歌Gemini上线AI音乐创作,一夜革了Suno的命!

[复制链接]

4077

主题

535

回帖

1万

积分

论坛元老

积分
12921
发表于 2026-2-19 15:41:20 | 显示全部楼层 |阅读模式
新智元报道
" M1 A# f2 [: l- X编辑:艾伦
* q2 d9 s( x6 X+ N# ?7 ^" G/ L* J【新智元导读】谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。3 U  q& ?4 r  I$ v
昨天,谷歌在 Gemini App 中上线了 AI 音乐生成功能。  Q. Q0 O* L* g& H
8 d2 j4 ]1 `5 x9 j& h

2 `5 I/ G1 Z( `2 v% C4 {% B用户输入一段文字描述,或者上传一张照片,几秒钟内就能得到一首 30 秒的完整歌曲,带人声、带歌词、带 AI 生成的封面。纯器乐当然也是支持的。
9 H) Y8 w6 z" f: r1 p, A驱动这个功能的是 DeepMind 最新的音乐生成模型 Lyria 3。
5 m: W3 Z4 |9 G; Z$ n
9 D$ i, b, S! u& \5 t6 N$ W( U% m' H6 Q, q3 f  p# i
谷歌对这项功能的定位,不是取代音乐人,而是让普通人获得一种全新的自我表达方式。
0 x+ C9 ~, n# u/ `做 AI 音乐生成的公司不少,但把它直接塞进一个拥有超过 7.5 亿月活用户的超级应用里,谷歌是头一个。
: @- Q* w. s- x; E: L! @$ d% r「30 秒」背后的技术跃迁
+ B, Y% M8 O2 ^  Q( S4 ~8 H从 2023 年发布初代 Lyria 算起,这已经是谷歌在音乐生成领域的第三代模型。, T3 i8 G3 T# @$ f
相比前代,Lyria 3 有几个明显的进步。
% W7 _" R5 O, q; f  Q9 a1 R! r过去用户需要自己写歌词输入模型,现在 Lyria 3 可以根据提示词自动生成歌词。
5 _6 l4 f1 |  x; w. i用户对风格、人声类型、节拍速度等元素的控制也更精细了。
& \; u+ O6 g; L2 ^+ J根据 DeepMind 官方推文,Lyria 3 输出 48kHz 立体声音频,人声表现更自然,歌词的咬字清晰度也有了明显提升。
& I+ @3 z$ L1 Z8 l! o5 W* X) J据数字音乐媒体 Digital Music News 报道,Lyria 3 的训练数据规模从 Lyria 2 的约 50 万首曲目扩展到了超过 200 万首,音频位深从此前版本升级到了 24-bit。
9 u% g: i. O. q1 }这意味着它在音质维度上甚至超过了 YouTube Music 等主流流媒体平台的标准。% U6 p- x6 y! f8 e; Q% }
除了文本生成音乐,用户还可以上传照片或视频,让 Gemini 根据视觉内容的情绪来作曲配词。- U0 z# j$ O5 O6 n7 `1 |
比如上传一张徒步的照片,Gemini 就能创作一首与之匹配的歌曲。' L( V  T1 p5 B/ }
封面则由谷歌的图像生成模型 Nano Banana 自动完成。8 [( _$ L9 q5 N& O8 _: U
功能目前以 Beta 形式向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,桌面端已率先上线,移动端将在未来几天内陆续推送。( |6 L7 v* ~0 U  ]$ f. D1 w
谷歌 AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。/ o$ ?! l3 k$ c6 Q, Z7 g  ?; a" {
与此同时,Lyria 3 也被整合进了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成背景音乐。这项功能此前仅限美国地区,此次正式面向全球创作者开放。
' F+ P5 I2 c' T! k; [$ R版权这张牌+ f$ h9 Q3 n9 ^8 k! p2 w
谷歌打得很小心
! T+ E: g) M9 rAI 音乐生成领域的版权纠纷从未停歇。
# E4 I8 b8 Y- z2024 年夏天,环球音乐、索尼音乐和华纳音乐联手对 AI 音乐初创公司 Suno 和 Udio 提起了总金额达 5 亿美元的版权侵权诉讼。
3 s& f5 s0 d  |1 c7 b+ ]9 d到 2025 年底,Suno 与华纳达成和解并获得授权,Udio 也分别与环球和华纳签署了协议。% b3 F& }( {* ]2 g  K
整个行业正在从对抗走向合作,但紧张关系远未消散。
5 k$ k% ?0 S& `在这个背景下,谷歌的措辞格外谨慎。- B4 Q9 M* N' ~) L! v( z
官方公告强调 Lyria 3 的设计目标是「原创表达,而非模仿现有艺术家」。; V2 S+ P2 A( v5 X( _9 J
如果用户在提示词中提到某位具体艺术家的名字,Gemini 只会将其作为宽泛的创作灵感,生成风格或情绪相似的作品,而非模仿该艺术家的声音。/ k. {7 K- \5 z' {" Z
谷歌还表示在训练过程中「非常注意版权和合作伙伴协议」,并设置了过滤器来比对输出内容与已有作品。
, `7 {+ g5 C4 {% T在内容标识层面,所有通过 Gemini 生成的音乐都会嵌入 SynthID 水印。- [, `# w' u( D$ K1 ~/ l/ I; N$ X
更值得关注的是,Gemini 现在还新增了音频鉴别功能——用户可以上传一段音频文件,询问它是否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推理给出判断。5 G8 x( \- T0 @; `- Z, {6 C3 o
这是继图片和视频鉴别之后,SynthID 覆盖的第三种媒体类型。
% l+ n" [3 D1 C' X+ ]& Z2 ~* d当音乐生成变成一场平台战争/ B$ R/ X* v0 {+ d
如果说 Suno 和 Udio 代表了 AI 音乐的创业浪潮,谷歌此举则标志着这场竞赛正式升级为平台级别的角力。
  W* j( d4 j- N. U/ H7 W/ \Suno 在 2024 年 11 月完成了 2.5 亿美元融资,其付费版本已经提供了虚拟音频工作站等专业编辑功能。' _  ]: _' a9 j& I
但 Suno 的月活用户量级与 Gemini 的 7.5 亿相比,根本不在同一个数量级。& Z/ F/ O9 S5 b# n
Tom's Guide 的编辑在体验后写道,她把丈夫的待办事项清单变成了一首朋克摇滚歌曲,然后通过短信发了出去。0 `9 X" G8 q! @+ ]5 Z! [
这种场景可能正是谷歌想要的:音乐生成的杀手级应用也许并不在录音棚里,而是藏在日常生活的每一条消息、每一次分享中。
3 \/ A! e& t  i$ }5 }. q30 秒的长度限制、Beta 阶段的粗糙感、版权争议的暗涌——Lyria 3 显然还远谈不上完美。% P$ L6 j  X3 `: Z
但谷歌选择在这个时间点把它推向 7.5 亿用户面前,传递的信号已经足够清晰:AI 音乐生成这件事,它不打算再等了。* P. d$ d0 r4 P1 ?0 s5 o
当每个人的口袋里都装着一个作曲家的时候,改变的或许不是音乐本身,而是我们与音乐之间的关系。- g/ H& @! B6 N  l! j$ G
参考资料:; X- b, b( n1 v- d3 Y4 r# [6 D
8 a+ c$ T7 G) q" n$ U! f2 I
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/4 J0 l& x" c6 p4 J& A5 f
https://x.com/GoogleDeepMind/status/2024153067654902014
集群智慧云科服专利申请服务
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表