批量视频音频违禁词检测

批量识别本地音视频内容，自动生成时间轴字幕并对照违禁词清单进行扫描，命中后输出详细报告，方便审核与整改。

BUG反馈

工具加载中，请稍等...

如无法加载或使用，请下载本地工具：https://tools.yikeaigc.com/

工具使用

返回旧版工具

此工具有软件版，功能更强大，更稳定前往软件版

使用说明

软件使用说明

选择待检测文件：点击"浏览文件"或"浏览文件夹"按钮，添加需要检测的音视频文件或文件夹，支持多选与拖拽。多个路径用英文分号分隔，支持 MP4、AVI、MKV、MOV、FLV、MP3、WAV、FLAC、M4A 等常见格式。
设置遍历方式：
- 遍历子目录：勾选后递归处理主文件夹及其全部子目录中的音视频文件
- 保持原路径结构：勾选后输出报告将与源文件夹的目录结构一致，重名时自动追加序号
选择违禁词文件：默认读取程序同目录下的"违禁词.txt"，关键词每行一条，支持 UTF-8 与 GBK 编码，以 # 开头的行视为注释。也可点击"浏览"按钮指定其它文本文件。
配置检测选项：
- 报告格式：可选 TXT 或 CSV 两种输出，记录序号、开始时间、结束时间、字幕内容、命中词
- 仅生成命中报告：勾选后未命中违禁词的文件不会生成报告
- 保留中间字幕：同时保存识别得到的 SRT 字幕，方便人工复查
- VAD 单段最长毫秒：调整长句切分阈值，长视频可适当调高
- 设备与线程：可选 CPU 或 CUDA GPU 推理，并设置并行线程数
选择保存目录：设置检测报告与字幕文件的输出位置，支持拖拽。
开始检测：点击"开始检测"按钮启动批量任务，下方进度条与日志会实时显示当前文件、识别进度与命中情况，处理过程中可点击"停止"按钮中断。
查看报告：检测完成后，进入保存目录即可查看 TXT 或 CSV 报告，按时间轴定位违禁词出现的位置，进行二次剪辑或修改。

常见问题

答：视频方面支持 MP4、AVI、MKV、MOV、FLV、WMV、WEBM、M4V、MPG、TS、3GP、RMVB 等格式；音频方面支持 MP3、WAV、FLAC、AAC、OGG、M4A、WMA、OPUS、AC3、AMR 等。识别引擎面向中文普通话内容进行了优化，方言或带口音的素材准确率会有所下降。

答：违禁词文件为普通 TXT 文本，每行一条关键词，空行和以 # 开头的注释行会被自动忽略。建议使用 UTF-8 编码保存，也兼容 GBK；可按主题分组并加上注释行，便于维护行业敏感词、品牌词、合规词等多套清单。

答：每条命中记录包含五个字段：序号、开始时间、结束时间、字幕内容、命中的违禁词。TXT 适合人工阅读和邮件转发，CSV 则可用 Excel、WPS 打开做筛选与统计，便于团队协作整改。

答：不会。语音识别使用本地 FunASR 模型完成，违禁词比对也在本机内存中进行，全过程不联网、不上传任何音视频或字幕内容，适合处理涉及隐私或商业机密的素材。

答：可以从以下几方面优化：1）若设备有 NVIDIA 显卡并安装了 CUDA 版 PyTorch，将设备切换为 GPU；2）适当调高 VAD 单段最长毫秒，减少切分开销；3）勾选"仅生成命中报告"减少 IO；4）分批添加文件夹处理，避免单次任务文件过多。

答：可以通过设置热词功能提高专有名词、人名、品牌名的识别准确率；同时建议在违禁词清单中收录关键词的常见同音字、谐音变体和缩写形式，配合保留 SRT 字幕的选项进行人工复核，提升整体覆盖率。

答：适合自媒体短视频上线前的合规自查、电商直播切片审核、培训课程与有声书内容复核、广告物料敏感词排查、历史素材批量整改等场景，帮助内容团队在上传前提前发现风险点。

答：本工具专注于检测与定位，会输出每条命中片段的精确时间轴。拿到报告后，可以根据时间点使用视频剪辑软件或本站的视频剪辑、配音替换类工具进行二次处理，达到删除、替换或消音的效果。

批量视频音频违禁词检测

工具加载中，请稍等...

工具使用