视频音频

Audiobox

Audiobox是Meta推出的免费AI语音和声音生成模型，能结合语音输入和自然语言文本提示生成语音和音效。模型包含Audiobox Speech（专注语音生成）和Audiobox Sound（专注音效生成）等专业模型，底层基于共享的自监督模型Audiobox SSL。

访问官网更新于 2026/04/15

工具分类视频音频按实际使用场景归类

官网入口audiobox.metademolab.com保留原站直达链接

收费方式免费开源最终价格以官网为准

关注人数12A+ 优先推荐

Audiobox 是什么

Audiobox 是一款面向视频音频场景的 AI 工具，Meta推出的免费AI语音和声音生成模型。

Audiobox是Meta推出的免费 AI语音和声音生成模型，能结合语音输入和自然语言文本提示生成语音和音效。模型包含Audiobox Speech（专注语音生成）和Audiobox Sound（专注音效生成）等专业模型，底层基于共享的自监督模型Audiobox SSL。Audiobox具备语音风格转换等独特功能，是首个实现语音与文本双输入自由语音风格转换的模型。Audiobox能降低音频创作门槛，让任何人都能轻松创作出个性化的音频内容，能用在视频、播客、游戏等多种场景。克隆用户声音：录制声音按照用户的声音风格或以任意音频样本的风格生成语音。

主要能力

01AI音频工具

克隆用户声音

02核心能力 02

文本描述生成人声

03核心能力 03

更改声音风格

04核心能力 04

文本描述生成音效

05核心能力 05

噪音消除

06核心能力 06

声音填充

适合场景

语音风格转换等独特功能

Audiobox 可用于语音风格转换等独特功能，适合先用一个真实任务验证输出质量。

Audiobox

Audiobox 是什么

主要能力

适合场景

如何开始使用 Audiobox

常见问题