Bark 是Suno创建的基于转换器的文本到音频模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型还可以产生非语言交流,如笑、叹息和哭泣。为了支持研究社区,我们提供对预训练模型检查点的访问,这些检查点已准备好进行推理并可用于商业用途。
https://github.com/suno-ai/bark

暂无评论...
Bark 是Suno创建的基于转换器的文本到音频模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型还可以产生非语言交流,如笑、叹息和哭泣。为了支持研究社区,我们提供对预训练模型检查点的访问,这些检查点已准备好进行推理并可用于商业用途。
https://github.com/suno-ai/bark