工具使用
此工具有软件版,功能更强大,更稳定
前往软件版
仅支持 Windows 10/11
批量音频人声分离工具 (软件版)
由于人声分离的 AI 模型推理需要消耗大量的计算资源,为了提供更稳定、高效的处理体验,此功能仅提供 Windows 桌面客户端版本。
支持音乐人声与伴奏批量分离
录音降噪、去回声去混响提取人声
本地离线处理,无需上传音频到服务器
点击将跳转至软件下载页面
使用说明
软件使用说明
- 添加音频文件:点击"添加文件"或"添加文件夹",导入需要处理的音频。支持批量导入,并可勾选"递归子目录"自动扫描文件夹内所有音频。支持MP3、WAV、FLAC、M4A、AAC、OGG等常见格式,也可直接处理MP4、MKV等视频中的音轨。
- 选择处理模式:
- 音乐人声分离:将歌曲分离为人声和伴奏两条音轨,可选高质量、推荐、快速等不同模型
- 录音降噪提取人声:针对录音、播客、直播等含背景噪声的素材,提取清晰人声
- 去回声去混响:去除人声中的回声与混响,可与降噪模式串联处理
- 设置模型目录:首次使用需将模型文件放入软件同级的 models 文件夹,软件会自动识别。若缺少模型,可按提示从下载地址获取对应模型文件。
- 配置处理选项:
- 输出格式:可选 WAV、FLAC、MP3
- 参数预设:提供均衡默认、速度优先、质量优先、低内存等预设
- 输出目录:指定分离结果的保存位置,并可保留原始目录结构
- 开始处理:点击"开始处理"按钮,软件将按队列依次完成所有音频的人声分离,进度与日志会实时显示。
- 查看结果:处理完成后,可在输出目录中找到分离后的人声与伴奏文件,文件名会标注对应的音轨类型。
常见问题
答:音乐人声分离面向歌曲,把演唱人声和乐器伴奏拆成两条音轨,适合做伴奏、翻唱、卡拉OK;录音降噪提取人声面向录音、播客、直播等素材,重点是去除背景噪声并保留说话或演唱人声。两种模式针对的场景不同,可按素材类型选择。
答:支持MP3、WAV、FLAC、M4A、AAC、OGG、OPUS、WMA、APE、AIFF等常见音频格式,也能直接读取MP4、MKV、MOV、AVI、WEBM等视频文件中的音轨进行分离。输出可选择WAV、FLAC或MP3格式。
答:人声分离依赖 AI 模型文件。请将对应的模型文件(如 Kim_Vocal_2.onnx、UVR-DeNoise.pth 等)放入软件同级的 models 文件夹后再选择模式。软件内提供了模型下载地址,按文件名下载放入目录即可被自动识别。
答:不会。所有分离与降噪处理都在您的设备本地完成,音频文件不会上传到服务器,处理结果也直接保存在本地输出目录,便于保护素材隐私和数据安全。
答:AI 人声分离需要一定的 CPU 和内存资源。建议:1)选择"速度优先"或"低内存"参数预设;2)分批处理大量文件;3)关闭其他占用内存的程序;4)若拥有 NVIDIA 显卡并安装了对应运行环境,可选择 GPU 模式提升速度。
答:可以。软件支持二段处理,先用降噪模型去除背景噪声提取人声,再用去回声去混响模型进一步处理,两步串联能让人声更加清晰干净,适合录音、播客和直播素材的后期整理。
答:处理完成后,软件会在输出目录生成对应文件,文件名中会标注音轨类型(如 Vocals 代表人声、Instrumental 代表伴奏)。您可以根据文件名后缀快速找到所需的人声或伴奏音轨。