【本地执行模式】 : 您的所有数据均在浏览器中处理,不会上传服务器,数据安全有保障。不放心的,可等待页面加载完成后 断网使用!(需提前登录账号)
【速度及稳定性】 : 处理速度由您的机器配置决定。由于浏览器差异,少数工具可能出现无法使用或异常:请使用:软件版工具
工具使用
仅支持 Windows 10/11
批量视频音频违禁词检测工具 (软件版)
由于本地语音识别和违禁词比对需要消耗较多 CPU 与显存资源,并依赖 FunASR 等离线模型,为了提供更稳定、可靠的处理体验,此功能仅提供 Windows 桌面客户端版本。
批量识别音视频内容,自动生成带时间轴的字幕
自定义违禁词清单,命中后输出 TXT 或 CSV 报告
全程本地离线处理,文件无需上传到服务器
点击将跳转至软件下载页面
使用说明
软件使用说明
- 选择待检测文件:点击"浏览文件"或"浏览文件夹"按钮,添加需要检测的音视频文件或文件夹,支持多选与拖拽。多个路径用英文分号分隔,支持 MP4、AVI、MKV、MOV、FLV、MP3、WAV、FLAC、M4A 等常见格式。
- 设置遍历方式:
- 遍历子目录:勾选后递归处理主文件夹及其全部子目录中的音视频文件
- 保持原路径结构:勾选后输出报告将与源文件夹的目录结构一致,重名时自动追加序号
- 选择违禁词文件:默认读取程序同目录下的"违禁词.txt",关键词每行一条,支持 UTF-8 与 GBK 编码,以 # 开头的行视为注释。也可点击"浏览"按钮指定其它文本文件。
- 配置检测选项:
- 报告格式:可选 TXT 或 CSV 两种输出,记录序号、开始时间、结束时间、字幕内容、命中词
- 仅生成命中报告:勾选后未命中违禁词的文件不会生成报告
- 保留中间字幕:同时保存识别得到的 SRT 字幕,方便人工复查
- VAD 单段最长毫秒:调整长句切分阈值,长视频可适当调高
- 设备与线程:可选 CPU 或 CUDA GPU 推理,并设置并行线程数
- 选择保存目录:设置检测报告与字幕文件的输出位置,支持拖拽。
- 开始检测:点击"开始检测"按钮启动批量任务,下方进度条与日志会实时显示当前文件、识别进度与命中情况,处理过程中可点击"停止"按钮中断。
- 查看报告:检测完成后,进入保存目录即可查看 TXT 或 CSV 报告,按时间轴定位违禁词出现的位置,进行二次剪辑或修改。
常见问题
答:视频方面支持 MP4、AVI、MKV、MOV、FLV、WMV、WEBM、M4V、MPG、TS、3GP、RMVB 等格式;音频方面支持 MP3、WAV、FLAC、AAC、OGG、M4A、WMA、OPUS、AC3、AMR 等。识别引擎面向中文普通话内容进行了优化,方言或带口音的素材准确率会有所下降。
答:违禁词文件为普通 TXT 文本,每行一条关键词,空行和以 # 开头的注释行会被自动忽略。建议使用 UTF-8 编码保存,也兼容 GBK;可按主题分组并加上注释行,便于维护行业敏感词、品牌词、合规词等多套清单。
答:每条命中记录包含五个字段:序号、开始时间、结束时间、字幕内容、命中的违禁词。TXT 适合人工阅读和邮件转发,CSV 则可用 Excel、WPS 打开做筛选与统计,便于团队协作整改。
答:不会。语音识别使用本地 FunASR 模型完成,违禁词比对也在本机内存中进行,全过程不联网、不上传任何音视频或字幕内容,适合处理涉及隐私或商业机密的素材。
答:可以从以下几方面优化:1)若设备有 NVIDIA 显卡并安装了 CUDA 版 PyTorch,将设备切换为 GPU;2)适当调高 VAD 单段最长毫秒,减少切分开销;3)勾选"仅生成命中报告"减少 IO;4)分批添加文件夹处理,避免单次任务文件过多。
答:可以通过设置热词功能提高专有名词、人名、品牌名的识别准确率;同时建议在违禁词清单中收录关键词的常见同音字、谐音变体和缩写形式,配合保留 SRT 字幕的选项进行人工复核,提升整体覆盖率。
答:适合自媒体短视频上线前的合规自查、电商直播切片审核、培训课程与有声书内容复核、广告物料敏感词排查、历史素材批量整改等场景,帮助内容团队在上传前提前发现风险点。
答:本工具专注于检测与定位,会输出每条命中片段的精确时间轴。拿到报告后,可以根据时间点使用视频剪辑软件或本站的视频剪辑、配音替换类工具进行二次处理,达到删除、替换或消音的效果。