【浏览器执行模式】 : 您的所有数据均在浏览器中处理,不会上传服务器,数据安全有保障。不放心的,可等待页面加载完成后 断网使用!(需提前登录账号)
【速度及稳定性】 : 处理速度由您的机器配置决定。由于浏览器差异,少数工具可能出现无法使用或异常:请使用:软件版工具
提示:请先选择文本来源,再到“规则设置”启用删除规则或输出清理并填写参数,确认预览无误后再开始处理。
1选择文本来源
TXT文件
可批量处理
粘贴文本
快速清洗
示例数据
一键体验
支持多选和拖拽;界面仅展示前20个文件,处理时会处理全部文件。
粘贴文本会以“粘贴文本.txt”作为下载文件名。
点击下方按钮加载示例文本,示例包含空行、广告行、重复行、短行、长行和编号行,便于测试不同删除规则。
2已选内容
0个文件尚未选择文件或输入文本。
1处理逻辑
空行规则
关键词规则
正则规则
行号规则
行号从1开始;-1表示末行,-2表示倒数第二行。
长度规则
重复行规则
前后行规则
输出清理
输出清理不会作为“匹配规则”参与删除判断,只在保留行后进行整理。
2匹配选项
1文本读取与换行
2下载方式
分别输出时会保留原文件名;遇到同名文件时,自动在文件名后追加数字区分,并打包为ZIP下载。
1统计预览
原始行数0
保留行数0
删除行数0
删除比例0%
处理前预览
暂无预览
处理后预览
暂无预览
2处理结果
未处理处理完成后会在这里显示前20个结果文件,全部结果可通过下载按钮获取。
请先选择文本来源并设置删除规则。
使用说明
软件使用说明
- 选择文本来源:上传一个或多个TXT文件,或切换到粘贴文本,也可以载入示例数据检查规则效果。
- 设置删除规则:
- 删除空行:可删除空白行,也可选择是否把只包含空格、制表符的行视为空行。
- 按关键词处理:输入一个或多个关键词,支持包含、不包含、大小写匹配等设置。
- 按正则处理:使用正则表达式匹配复杂文本格式,适合日志、名单、代码片段等内容清理。
- 按行号处理:可输入单个行号或范围,例如
1,5,8-12,-1,行号从1开始计算。 - 按长度处理:根据每行字符数大于、小于、等于或介于某个范围来删除。
- 重复行处理:可移除重复行,并可选择是否忽略大小写或首尾空格。
- 选择处理模式:删除模式会移除命中的行;保留模式会只保留命中的行,适合反向筛选。
- 配置输出选项:可设置编码、换行符、是否添加UTF-8 BOM、是否保留末尾换行,以及单文件或合并输出方式。
- 预览处理结果:点击预览或开始处理前,先查看命中行数、保留行数和示例结果,确认规则符合预期。
- 下载处理文件:单个文件可直接下载;多个文件会打包为ZIP。同名文件会自动添加编号,便于区分。
常见问题
答:可以。选择“满足任意规则”时,文本行命中任一启用规则就会被处理;选择“满足全部规则”时,文本行需要同时命中启用规则才会被处理。
答:删除模式会移除命中规则的行,适合清理广告、空行、重复内容等;保留模式会只保留命中规则的行,适合从文本中筛选需要的内容。
答:行号从1开始计算,可填写单个行号、多个行号或范围,例如
1,5,8-12。也支持负数行号,例如 -1 表示末尾一行。
答:关键词规则按输入内容进行普通文本匹配,适合处理固定词语;正则规则可匹配更复杂的格式,例如编号、日期、邮箱、日志级别等内容。
答:处理结果会尽量保留原文件名。遇到同名文件时,会在文件名后添加编号,例如
data.txt、data(2).txt、data(3).txt。
答:不会。文件读取、规则匹配、预览和结果生成都在当前页面本地完成,不会把TXT文件发送到服务器。
答:大文件会占用较多内存和CPU资源。建议分批处理文件、减少同时选择的文件数量,并在处理前通过预览确认规则,避免重复计算。
答:一般可使用自动识别编码。需要跨平台使用时可选择UTF-8;Windows文档常用CRLF换行,Linux或代码类文本常用LF换行。