【浏览器执行模式】 : 您的所有数据均在浏览器中处理,不会上传服务器,数据安全有保障。不放心的,可等待页面加载完成后 断网使用!(需提前登录账号)
【速度及稳定性】 : 处理速度由您的机器配置决定。由于浏览器差异,少数工具可能出现无法使用或异常:请使用:软件版工具
工具使用
返回旧版工具
请先设置清理规则,再导入HTML内容并开始处理
支持粘贴代码、批量文件和示例数据;批量文件只展示前20个,处理会包含全部文件。
本地文本处理
建议先选择保留换行、链接、图片描述和输出格式等参数,再处理内容。需要快速体验时,可直接载入示例数据。
1文本结构控制段落和空白
2输出格式单个和批量共用
3文件参数处理前可调整
4清理规则可保存为下次默认设置
请先确认清理规则,再进入内容导入。
1选择输入方式
文件内容在当前设备读取并处理
2粘贴HTML代码
支持完整页面或片段
2选择HTML/TXT文件
可一次选择多个文件
2选择示例
示例会替换当前输入
示例仅用于体验功能,载入后可继续修改设置再处理。
3内容概览
尚未添加内容
粘贴文本或选择文件后,这里会显示当前待处理内容。批量文件只显示前20个。
请先添加HTML文本或文件。
1开始处理请确认已完成设置和导入
请先设置再处理
完成清理设置并导入内容后,点击下方按钮清除HTML标签。
2处理进度等待开始
等待处理。
还没有处理结果。请按步骤完成处理后再查看。
3结果预览
显示首个处理结果
处理完成后会显示前20个结果文件。
4处理明细前20个结果用于核对
| # | 原文件名 | 输出文件名 | 原始长度 | 结果长度 | 标签数 | 状态 |
|---|
批量ZIP会保留原文件名;遇到重名时自动在文件名后追加数字。
使用说明
软件使用说明
- 配置清理规则:进入“清理设置”,先选择换行处理、空白处理、输出格式和批量文件名规则。
- 选择需要移除的内容:
- 移除脚本内容:清除script、noscript、template等代码内容。
- 移除样式内容:清除style标签内容和行内style属性。
- 移除HTML注释:清理源码中的注释内容。
- 额外移除选择器:可填写.ad、#footer、nav等选择器,用于删除指定区块。
- 设置保留内容:
- 保留链接地址:将链接转换为“文字 [URL]”格式。
- 保留图片描述:提取图片alt、title或文件名作为文本提示。
- 保留指定标签:输入a,strong,em,br等标签名,可保留部分HTML结构。
- 解码HTML实体:将 、<、&等实体转换为可读字符。
- 导入HTML内容:进入“导入内容”,可直接粘贴HTML代码,也可批量选择html、htm、txt、xml、xhtml、shtml文件。
- 使用示例数据:可选择文章页面、表格片段或混合代码示例,快速查看清理效果。
- 开始处理:进入“处理结果”,点击“清除HTML标签”生成结果。
- 复制和下载:单个结果可复制或下载;批量处理后可下载ZIP压缩包,重名文件会自动追加数字区分。
常见问题
答:可以。在“换行处理”中选择“智能保留段落换行”,工具会把p、div、br、li、tr等结构转换为换行,让结果更容易阅读。
答:勾选“保留链接地址”后,链接会转换为“链接文字 [URL]”格式,适合整理资料、归档网页内容或导出文本。
答:默认与原文件名一致。如果压缩包中遇到重名文件,会自动在文件名后追加数字进行区分;也可以选择添加自定义后缀。
答:支持html、htm、txt、xml、xhtml、shtml等文本类文件。批量选择多个文件时,界面只展示前20个,处理会包含全部文件。
答:HTML实体是用代码表示的字符,例如 、<、&。开启解码后会转换为对应字符;关闭后会保留原实体写法。
答:在“保留标签”输入框中填写需要保留的标签名,并用英文逗号分隔,例如a,strong,em,br。未填写时会按纯文本方式移除标签。
答:可在“文件编码”中切换UTF-8或GB18030 / GBK后重新处理。如果原文件编码较特殊,建议先用文本编辑器转换为常见编码。