招标文件解析（Tender Document Parsing）

v1.0.1

招标文件解析助手。自动解析招标文档（PDF/DOCX/TXT），提取资格审查项、废标项、评分标准、技术要求、装订要求、格式要求等6类关键信息，默认输出为结构化Word（DOCX）报告，带PDF原始页码标注。

0· 0·0 当前·0 累计

by @junqio

文档工具文件处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install bidding-document-parser

镜像加速npx clawhub@latest install bidding-document-parser --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

招标文件解析 SKILL 概述本SKILL用于解析招标文件，自动识别并提取6类关键信息，生成结构化的Word（DOCX）分析报告（带PDF原始页码标注）。

触发条件当用户输入以下任一内容时，应加载本SKILL：关键词："解析招标文件"、"分析招标文档"、"提取招标要点"、"招标文件解析" 上传招标相关文件（PDF、DOCX、TXT）提供招标文件文本内容

工作流程步骤1：获取招标文件内容根据输入类型选择解析方式：输入为PDF文件必须使用带页码的PDF转换工具使用Python脚本 scripts/extract_pdf_with_pages.py（基于pdfplumber库，保留页码信息）执行命令： cd "[workspace]" py scripts/extract_pdf_with_pages.py "PDF文件路径" # 或指定输出路径 py scripts/extract_pdf_with_pages.py "PDF文件路径" "输出TXT路径" 输出文件：_带页码.txt（默认与PDF同目录）禁止使用 @pdf skill（无法保留页码信息）输入为DOCX文件使用 @docx skill 读取内容或使用 Markdown Converter skill 转换输入为文本内容直接使用提供的文本输入为文件路径根据扩展名选择上述对应方式

步骤2：提取6类关键信息使用方法：读取 references/extraction_prompt.md 文件，获取完整的提取提示词模板。执行步骤：读取 references/extraction_prompt.md 文件内容将招标文件内容插入到模板的 [在此插入招标文件文本内容] 位置使用填充后的提示词模板进行信息提取按照模板中的表格格式输出6类关键信息提取的6类信息：资格审查项废标项/取消资格项评分标准得分项/加分项技术要求装订要求格式要求重要：凡涉及"废标"、"取消资格"、"投标作废"、"投标文件作废"、"无效标"等描述的条款，均应列入废标项必须添加PDF原始页码标注（格式：P5、P9-10）

步骤3：生成Markdown报告（中间格式）将提取的6类信息整合为一个完整的Markdown文档，包含：报告标题：# 招标文件解析报告项目基本信息（项目名称、编号、解析日期、招标人、集采机构） 6个章节，每章为一个表格必须添加PDF原始页码标注（如：P5、P9-10）总结和建议（可选）保存为Markdown文件：文件名：招标文件解析报告_[项目名称]_[YYYYMMDD].md 保存路径：[workspace]/（工作空间根目录）如无法获取项目名称，使用招标文件解析报告_未知项目_[YYYYMMDD].md

步骤4：生成DOCX报告（必须执行）执行方式：使用Python脚本 scripts/md_to_docx.py 将Markdown报告转换为DOCX格式。重要：此步骤为必须执行步骤，DOCX格式为默认输出格式。执行命令： cd "[workspace]" py scripts/md_to_docx.py "招标文件解析报告_XXX_YYYYMMDD.md" "招标文件解析报告_XXX_YYYYMMDD.docx" 输入输出：输入：[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].md 输出：[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].docx 格式规范：详细格式规范参见 references/report_format.md 全文微软雅黑字体表格：深蓝色表头（#2E5496）、黑色边框、无首行缩进自动清理LaTeX公式页码标注格式：P4、P9-15 注意： [workspace] 为当前会话的工作空间路径（如 e:/000 Skills/招标文件解析）如Markdown报告中无页码标注，DOCX表格中"页码"列留空

工具和依赖 PDF文件解析必须使用带页码的工具工具路径说明 extract_pdf_with_pages.py scripts/extract_pdf_with_pages.py 基于pdfplumber，保留页码，优先使用 @pdf skill — 禁止使用（无法保留页码） DOCX报告生成工具路径说明 md_to_docx.py scripts/md_to_docx.py 核心转换脚本，已修复字体/表格问题 validate_and_fix_md.py scripts/validate_and_fix_md.py MD格式检查与自动修复 auto_convert.py scripts/auto_convert.py 一键格式检查+转换 DOCX文件解析 @docx skill 或 Markdown Converter skill Python依赖 pdfplumber # PDF解析 python-docx # DOCX生成参考文档 references/extraction_prompt.md：提取提示词模板 references/report_format.md：报告格式规范

注意事项大文件处理：如招标文件超过字数限制，可分段解析后整合表格合并：如同一类信息分散在文件多个位置，应合并到同一表格歧义处理：如条款理解有歧义，应在备注中说明更新记录：如用户后续补充信息，可更新报告并注明更新日期文件路径说明 [workspace]：当前会话工作空间根目录当前项目：e:/000 Skills/招标文件解析 scripts/：可执行脚本目录（位于 .workbuddy/skills/bidding-document-parser/scripts/） references/：模板和格式规范文档所有输出文件默认保存到 [workspace]/ 目录

数据来源：ClawHub ↗ · 中文优化：龙虾技能库