Text Processor — 文本处理器
v1.0.0批量中文文本处理 —— 清洗、归一化、翻译、提取关键词以及为内容生产格式化文本。
运行时依赖
安装命令
点击复制技能文档
文本处理器 一个批量文本处理实用程序,用于内容工作流。处理中文文本规范化、清理、格式化和结构化提取。设计用于内容创作者、编辑和自动化管道。
功能 文本清理:删除多余的空白字符,修复标点,规范化引号 中文规范化:全角/半角转换,简体/繁体转换 批量处理:一次处理多个文本项 格式转换:Markdown ⇌ 纯文本,编号列表,表格 关键词提取:从中文文本中提取关键词和短语
用法 const processor = require('./skills/text-processor'); // 清理和规范化 const cleaned = processor.clean(" Hello,世界! This has ”bad” quotes. "); // → "Hello,世界!This has "bad" quotes." // 从中文文本中提取关键词 const keywords = processor.extractKeywords("今天天气很好,适合出去郊游"); // → ["天气", "郊游", ...] // 批量处理 const results = processor.batch([ " 文本1 ", " 文本2 " ], 'clean'); // → ["文本1", "文本2"]
API clean(text) 规范化和清理中英文混合文本:修剪空白字符,合并多个空格,规范化引号(«»「」"" → 标准"") 规范化全角/半角标点 extractKeywords(text, maxCount?) 使用 TF 启发式从中文文本中提取有意义的关键词。 batch(items, operation, options?) 使用相同的操作处理文本数组。
许可证 MIT