【浏览器执行模式】 : 您的所有数据均在浏览器中处理,不会上传服务器,数据安全有保障。不放心的,可等待页面加载完成后 断网使用!(需提前登录账号)
【速度及稳定性】 : 处理速度由您的机器配置决定。由于浏览器差异,少数工具可能出现无法使用或异常:请使用:软件版工具
工具使用
返回旧版工具请先设置段落、句子和清理规则,再输入文本或选择文件处理。示例数据可用于快速查看效果。
请先设置再处理
当前尚未添加待统计内容。
1段落分割
2句子分割
3词数与导出
4清理规则
统计会基于清理后的文本计算,结果报告会记录当前规则。
5统计细节
英文缩写、小数点和标点范围会影响分句和字符统计。
建议先保存常用规则,再进入输入步骤。
1选择输入方式
2输入文本
输入后实时刷新统计结果;点击处理后会写入结果列表,方便导出。
2添加文件
界面展示前20个文件,处理时会包含已选择的全部文件。
点击选择文件或拖拽到此处
支持 .txt、.md、.docx、.pdf。DOCX 和 PDF 会在本地抽取文本后统计。
2加载示例
示例数据会替换当前输入内容或文件列表。
3实时统计
直接输入模式会自动更新此处结果。
4执行处理
等待开始。
尚未添加待统计内容。
还没有统计结果。请按步骤完成处理后再查看。
| 名称 | 段落 | 句子 | 词数 | 字符 | 非空白 | 平均句长 | 平均段长 | 行数 | 状态 |
|---|
详情
点击表格行可查看段落、句子样例和单项报告。
使用说明
软件使用说明
- 设置统计规则:先进入“统计设置”,选择段落分割、句子分割、词数统计模式和报告命名模板。
- 配置清理选项:
- 段落分割:支持空行分割、每行一个段落、首行缩进识别。
- 句子分割:支持按句末标点、按换行、标点与换行结合。
- 文本清理:可统一换行、去首尾空白、折叠多空白、合并软换行、移除HTML标签、忽略括号内容。
- 统计细节:可保护英文缩写、小数点,选择是否在字符统计中忽略标点。
- 输入或选择文件:
- 直接输入:粘贴文本后实时显示段落、句子、词数和字符统计。
- 批量文件:选择TXT、MD、DOCX、PDF文件。界面只展示前20个文件,其余文件会一并处理。
- 示例数据:可加载中文稿件、中英混排或批量文本示例,快速查看统计效果。
- 开始处理:确认设置和输入内容后,点击“开始处理”,工具会按当前规则生成统计结果。
- 查看结果:结果页展示段落数、句子数、词数、字符数、非空白字符、平均句长、平均段长和处理状态。点击表格行可查看段落样例、句子样例和文本预览。
- 导出结果:可导出CSV汇总,也可下载ZIP压缩包。ZIP包含summary.csv、results.json、统计说明和逐文件TXT报告。
常见问题
答:空行分割适合常规文章;每行一个段落适合清单、表格导出文本;首行缩进识别适合排版较规范的长文稿件。
答:句子统计依赖标点、换行和保护规则。遇到标题、编号、缩写、小数点或特殊排版时,建议开启“保护英文缩写”和“保护小数点”,并按文本类型切换分句方式。
答:从PDF、网页或排版软件复制文本时,正文中可能出现不自然的断行。开启“合并软换行”后,工具会尽量把连续正文行合并,减少段落被拆散的情况。
答:支持TXT、MD、DOCX、PDF。DOCX会抽取正文文本,PDF会读取文本层内容;如果PDF是扫描图片,需要先做OCR识别后再统计。
答:为保持界面流畅,文件列表只展示前20个作为核对。实际处理时会包含已选择的全部文件,结果会完整写入CSV、JSON和逐文件报告。
答:中文按字+英文按词适合中英混排文本;按空白分词适合英文或以空格分词的内容;仅统计汉字和仅统计英文词适合单独核对某一类文本数量。
答:ZIP包含summary.csv汇总表、results.json结构化数据、统计说明.txt和reports目录下的逐文件TXT报告。如勾选“附带提取文本”,还会包含texts目录。