速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI 生成 11 秒音频

速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI 生成 11 秒音频
2025年05月15日 09:18 IT之家

IT之家 5 月 15 日消息,科技媒体 TechCrunch 昨日(5 月 14 日)发布博文,报道称 AI 初创公司 Stability AI 推出 Stable Audio Open Small,号称是市场上速度最快的“立体声”音频生成 AI 模型,可在智能手机上运行。

相比较 Suno 和 Udio 等其他 AI 音频应用,Stable Audio Open Small 无需依赖云端处理,其高效设计让它能在智能手机上流畅运行。Stability AI 表示,该模型能在不到 8 秒的时间内,在手机上生成最长 11 秒的音频片段,适用于快速制作鼓点或乐器片段等音效。

在训练方面,Stability AI 携手芯片制造商 Arm,针对 Arm CPU 特别优化,可以在智能手机上离线运行;在训练数据集方面,不同于 Suno 和 Udio 等竞争对手(据称使用了含版权内容的数据,存在知识产权风险),全部来自 Free Music Archive 和 Freesound 免版税音频库。

IT之家注:现阶段 Stable Audio Open Small 仅支持英文提示,无法生成逼真的歌声或高质量歌曲,且由于训练数据偏向西方风格,不同音乐类型的表现参差不齐

此外使用条款较为严格:研究人员、爱好者及年收入低于 100 万美元的企业可免费使用,但超过这一收入门槛的开发者或组织需购买 Stability AI 的企业许可证。

AI智能手机
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片