工具使用
此工具有软件版,功能更强大,更稳定
前往软件版
仅支持 Windows 10/11
批量文档乱码修复工具 (软件版)
由于乱码逆向还原与多编码智能检测需要消耗较多的计算资源,为了提供更稳定、高效的处理体验,此功能仅提供 Windows 桌面客户端版本。
自动检测 UTF-8/GBK/GB18030/Big5 编码
支持 TXT/SRT/Word/Excel/PPT 等格式
海量文件批量修复,本地处理保护隐私
点击将跳转至软件下载页面
软件使用说明
- 添加文件或文件夹:点击"添加文件"或"添加文件夹"按钮,选择需要修复的乱码文档。支持一次性导入海量文件,文件夹可勾选"包含子文件夹"递归处理。
- 选择源编码:
- 自动检测(推荐):程序自动识别每个文件的原始编码并还原中文
- 强制指定:当自动识别不理想时,可手动指定 UTF-8、GBK、GB18030、Big5、UTF-16、Shift-JIS 等源编码
- 设置目标编码:从下拉框选择输出编码,常用 UTF-8(推荐)、UTF-8+BOM、GBK、GB18030、ANSI、UTF-16,按需统一文档编码格式。
- 配置处理选项:
- 乱码逆向修复:还原"锟斤拷""�"等已损坏的字符
- 仅输出有改动文件:跳过本就正常的文档,减少冗余
- 保持原目录结构:递归处理时按原层级输出到目标文件夹
- 处理疑似二进制文件:按需开启,默认自动跳过图片等非文本文件
- 预览对比:选中单个文件可查看修复前后的文本对照,确认效果后再批量执行。
- 开始修复:设置输出目录后点击"开始处理",进度条实时显示处理数量,日志区记录成功、跳过与失败明细。
- 查看结果:处理完成后可在输出目录查看修复后的文档,并可导出处理报告(CSV)留存。
常见问题
答:支持 TXT、CSV、Markdown、SRT/ASS/VTT 字幕、JSON、XML、HTML、INI、SQL 等纯文本类格式,以及 Word(.docx)、Excel(.xlsx)、PPT(.pptx) 文档。旧版二进制的 .doc/.xls/.ppt 暂不支持,建议先另存为新格式再处理。
答:少数短文本或多编码混排文件可能识别偏差,此时可在"源编码"中手动指定为 GBK、GB18030、Big5 等已知编码后再处理。也可先用预览功能对比修复效果,确认无误后再批量执行。
答:可以。开启"乱码逆向修复"后,程序会针对 UTF-8 被按 Latin-1、GBK 等误读产生的典型乱码进行逆向还原,并通过文本评分判断,仅在还原结果明显更可读时才采纳,避免误伤正常中文。
答:不会。修复结果输出到您指定的目标目录,原始文件保持不变。若目标位置存在同名文件,程序会自动在文件名后追加序号,防止覆盖,保障数据安全。
答:不会。所有检测与修复都在您的本地设备完成,文档内容不经过任何网络传输,适合处理涉及隐私或机密的资料。
答:可以。针对超大文本文件采用采样检测加分块流式转换的方式,按整行缓冲再修复,避免一次性占用过多内存,也防止乱码序列被切在数据块边界导致还原失败。
答:当目标编码(如 GBK)无法表示原文中的某些字符(如生僻字、特殊符号)时,会以替代符占位。建议将目标编码设置为 UTF-8 或 GB18030,它们的字符覆盖范围更广,可减少此类情况。
使用说明
软件使用说明
- 添加文件或文件夹:点击"添加文件"或"添加文件夹"按钮,选择需要修复的乱码文档。支持一次性导入海量文件,文件夹可勾选"包含子文件夹"递归处理。
- 选择源编码:
- 自动检测(推荐):程序自动识别每个文件的原始编码并还原中文
- 强制指定:当自动识别不理想时,可手动指定 UTF-8、GBK、GB18030、Big5、UTF-16、Shift-JIS 等源编码
- 设置目标编码:从下拉框选择输出编码,常用 UTF-8(推荐)、UTF-8+BOM、GBK、GB18030、ANSI、UTF-16,按需统一文档编码格式。
- 配置处理选项:
- 乱码逆向修复:还原"锟斤拷""�"等已损坏的字符
- 仅输出有改动文件:跳过本就正常的文档,减少冗余
- 保持原目录结构:递归处理时按原层级输出到目标文件夹
- 处理疑似二进制文件:按需开启,默认自动跳过图片等非文本文件
- 预览对比:选中单个文件可查看修复前后的文本对照,确认效果后再批量执行。
- 开始修复:设置输出目录后点击"开始处理",进度条实时显示处理数量,日志区记录成功、跳过与失败明细。
- 查看结果:处理完成后可在输出目录查看修复后的文档,并可导出处理报告(CSV)留存。
常见问题
答:支持 TXT、CSV、Markdown、SRT/ASS/VTT 字幕、JSON、XML、HTML、INI、SQL 等纯文本类格式,以及 Word(.docx)、Excel(.xlsx)、PPT(.pptx) 文档。旧版二进制的 .doc/.xls/.ppt 暂不支持,建议先另存为新格式再处理。
答:少数短文本或多编码混排文件可能识别偏差,此时可在"源编码"中手动指定为 GBK、GB18030、Big5 等已知编码后再处理。也可先用预览功能对比修复效果,确认无误后再批量执行。
答:可以。开启"乱码逆向修复"后,程序会针对 UTF-8 被按 Latin-1、GBK 等误读产生的典型乱码进行逆向还原,并通过文本评分判断,仅在还原结果明显更可读时才采纳,避免误伤正常中文。
答:不会。修复结果输出到您指定的目标目录,原始文件保持不变。若目标位置存在同名文件,程序会自动在文件名后追加序号,防止覆盖,保障数据安全。
答:不会。所有检测与修复都在您的本地设备完成,文档内容不经过任何网络传输,适合处理涉及隐私或机密的资料。
答:可以。针对超大文本文件采用采样检测加分块流式转换的方式,按整行缓冲再修复,避免一次性占用过多内存,也防止乱码序列被切在数据块边界导致还原失败。
答:当目标编码(如 GBK)无法表示原文中的某些字符(如生僻字、特殊符号)时,会以替代符占位。建议将目标编码设置为 UTF-8 或 GB18030,它们的字符覆盖范围更广,可减少此类情况。