【浏览器执行模式】 : 您的所有数据均在浏览器中处理,不会上传服务器,数据安全有保障。不放心的,可等待页面加载完成后 断网使用!(需提前登录账号)
【速度及稳定性】 : 处理速度由您的机器配置决定。由于浏览器差异,少数工具可能出现无法使用或异常:请使用:软件版工具
工具使用
请先完成筛选设置和输出设置,再开始处理。 文件内容只在当前页面读取、解析和打包;批量选择时界面展示前20个,处理时覆盖全部已选文件。
未选择数据
规则已默认
输出已默认
1选择TXT或文本文件
点击选择文件,或把文件拖拽到这里
支持 TXT、CSV、LOG、HTML、JSON 等文本文件;也可选择文件夹批量读取。
如果选择多个文件,预览列表只显示前20个;处理和打包会包含全部文件。
2文件概览
已选文件0
文件大小0 KB
展示数量0
来源模式文件
请选择文件、粘贴URL文本,或加载示例数据。
1解析方式与输出内容
混合文本建议选择“提取全部URL”。
2域名后缀与主机规则
常用后缀
3关键词、路径与去重
1输出文件结构
逐文件输出会保持原文件名;重名会自动追加数字。
2ZIP与附加文件
请确认已完成数据来源、筛选设置和输出设置。点击开始后会在当前页面处理全部已选文件,并生成ZIP下载包。
等待处理0%
扫描文件0
发现URL0
符合条件0
去重移除0
输出文件0
预览处理结果
尚未处理| 序号 | 来源文件 | 输出内容 | 后缀 | 状态 |
|---|---|---|---|---|
| 尚未处理。请先完成设置,再点击开始处理。 | ||||
使用说明
软件使用说明
- 选择数据来源:在“数据来源”页选择TXT、CSV、LOG等文本文件,也可以选择文件夹、粘贴URL列表,或加载示例数据体验流程。
- 设置解析方式:
- 从文本中提取全部URL:适合日志、网页源码、JSON片段等混合内容。
- 按每行一个URL处理:适合已经整理好的网址清单。
- 选择输出内容:可选择根域名、完整域名、协议+域名、完整URL、原始片段、域名后缀等结果类型。
- 配置筛选规则:
- 后缀过滤:可只保留或排除.com、.cn、.com.cn、.co.uk等域名后缀。
- 协议过滤:可不限协议,也可只保留HTTP或HTTPS。
- 关键词过滤:可按域名包含、域名排除、路径包含关键词进行筛选。
- 去重设置:支持全局去重、单文件内去重,也可保留重复结果。
- 设置输出方式:可逐文件输出并保持原文件名,也可按结果类型分文件夹输出,或合并为一个结果文件。
- 开始处理并下载:进入“处理下载”页点击“开始处理”,完成后点击“下载ZIP结果”保存处理后的文件。
常见问题
答:根域名是example.com这类主域名;完整域名会保留www、blog、shop等子域名;协议域名会保留http或https,例如https://www.example.com。
答:常见原因包括格式不完整、域名层级不足、包含异常字符、协议不是HTTP/HTTPS,或被后缀、关键词、协议规则过滤。可勾选“生成未识别片段”查看排查文件。
答:可以直接勾选常用后缀,也可以在自定义后缀中填写.com、.net、.com.cn等内容,多个后缀用逗号、分号或换行分隔。
答:逐文件输出时会保持原文件名。如果多个文件同名,系统会在文件名后追加数字,例如list.txt、list(2).txt,避免结果互相覆盖。
答:需要跨多个文件统一清洗时选择“全局去重”;希望每个文件各自保留一份结果时选择“每个文件内去重”;需要保留频次或原始重复记录时选择“不去重”。
答:不会。文件内容在当前页面完成读取、筛选和打包,不会上传到服务器,适合处理包含内部链接、日志片段或站点清单的数据。
答:默认包含按原文件名生成的处理结果和统计报告。若启用“未识别片段”,还会额外生成排查文件,记录无法解析的URL片段及原因。