Meta 发布 Voicebox AI 模型

6 月 19 日消息,Meta 目前发布了 Voicebox AI 模型,相对于只能使用文字或图片回复的竞品模型,Voicebox AI 模型的优势主要如其名,能够生成用于回复的音频消息

据悉,Voicebox AI 模型只需要一段 2 秒钟的音频样本,即可准确辨别出音频细节、音色,并基于文字结果转换为语音输出,支持英语、法语、德语、西班牙语。此外,Voicebox 还具备“基于语音片段前后内容来补齐中间缺失内容”的能力。

Meta 表示,Voicebox 可以为基于 AI 的虚拟助手或元宇宙中的 NPC 提供自然而真实的语音效果。而对于无障碍方面而言,Voicebox 也可以对声带受损的人群提供一定的协助作用