当前位置：首页 > 技术分享 > 正文内容

Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！

lmwmm2年前 (2024-08-21)技术分享1597

AI 圈又有大新闻啦！Stability AI 又悄悄放出一个大招，这次不再是画图，而是音乐生成！而且还是开源的！

这个新工具叫 Stable Audio Open，简单来说，用文字就能生成各种音频——无论是鼓点、旋律，还是环境音效，全都不在话下！最最最重要的是，它还能为 Sora 和可灵这些视频生成配音！接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

【点击前往】

2.本地一键安装包：【点击下载】，适合新手，低配的电脑也能运行，但是效果没有第3种好！

3.手动安装

首先，将存储库克隆到本地机器：

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows ：

python -m venv venv
venv\Scripts\activate

macOS 和 Linux：

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py：

pip install stable-audio-tools
pip install .

Windows 用户的额外步骤

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU，请卸载并重新安装torch、，torchvision并torchaudio使用正确的 CUDA 版本：

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录（.wav 和 .mid 文件将存储在此处）：

{
    "model_directory": "models",
    "output_directory": "generations"
}

使用方法

运行 Gradio 界面

使用批处理文件或直接从命令行启动 Gradio 界面：

批处理文件示例：

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行：

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

生成音频和 MIDI

Gradio 界面中的输入提示会生成音频和 MIDI 文件，这些文件将按照中指定的方式保存config.json。

该界面已经扩展了 Bar/BPM 设置（可修改用户提示 + 样本长度条件）、MIDI 显示 + 转换，还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即，一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中，但重要的是，它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型，只需使用下拉菜单选择要加载的模型，然后选择“加载模型”。

扫描二维码推送至手机访问。

本文链接：https://lmwmm.com/post/3730.html

分享给朋友：

返回列表

上一篇：2024年如何获取一个免费使用的64核16GB的VPS服务器？

下一篇：Cloudflare WARP+ 重振旗鼓！挟 MASQUE 协议再度出山！

“Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！” 的相关文章

Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！

Stable Audio 2.0

创建虚拟环境

安装所需的软件包

Windows 用户的额外步骤

配置

使用方法

运行 Gradio 界面

生成音频和 MIDI

“Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！” 的相关文章

抖音宣布全量开放帐号IP属地功能

谷歌CEO要求全员测试Bard AI聊天机器人

为什么AutoGPT这么火爆？手把手带你安装和体验AI自主机器人

Windows 11 23H2 新增"系统组件"中心

Gemini ：谷歌发布最强AI大模型！打爆GPT-4

《瘟疫传说：无罪》现已登陆Epic Games Store，尽情畅玩BB电子游戏精彩体验

黑公网安备 23010302001359号 黑ICP备2022000645号-1 全站地图

Powered By Z-BlogPHP. Theme by lmwmm.com.

Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！

Stable Audio 2.0

创建虚拟环境

安装所需的软件包

Windows 用户的额外步骤

配置

使用方法

运行 Gradio 界面

生成音频和 MIDI

“Stability AI 偷偷发布黑科技，秒杀Suno AI 的音乐生成！” 的相关文章

抖音宣布全量开放帐号IP属地功能

谷歌CEO要求全员测试Bard AI聊天机器人

为什么AutoGPT这么火爆？手把手带你安装和体验AI自主机器人

Windows 11 23H2 新增"系统组件"中心

Gemini ：谷歌发布最强AI大模型！打爆GPT-4

《瘟疫传说：无罪》现已登陆Epic Games Store，尽情畅玩BB电子游戏精彩体验

黑公网安备 23010302001359号 黑ICP备2022000645号-1 全站地图

Powered By Z-BlogPHP. Theme by lmwmm.com.

黑公网安备 23010302001359号黑ICP备2022000645号-1 全站地图