运行时依赖
安装命令
点击复制技能文档
招标文件解析 SKILL 概述 本SKILL用于解析招标文件,自动识别并提取6类关键信息,生成结构化的Word(DOCX)分析报告(带PDF原始页码标注)。
触发条件 当用户输入以下任一内容时,应加载本SKILL: 关键词:"解析招标文件"、"分析招标文档"、"提取招标要点"、"招标文件解析" 上传招标相关文件(PDF、DOCX、TXT) 提供招标文件文本内容
工作流程 步骤1:获取招标文件内容 根据输入类型选择解析方式: 输入为PDF文件 必须使用带页码的PDF转换工具 使用Python脚本 scripts/extract_pdf_with_pages.py(基于pdfplumber库,保留页码信息) 执行命令: cd "[workspace]" py scripts/extract_pdf_with_pages.py "PDF文件路径" # 或指定输出路径 py scripts/extract_pdf_with_pages.py "PDF文件路径" "输出TXT路径" 输出文件:_带页码.txt(默认与PDF同目录) 禁止使用 @pdf skill(无法保留页码信息) 输入为DOCX文件 使用 @docx skill 读取内容 或使用 Markdown Converter skill 转换 输入为文本内容 直接使用提供的文本 输入为文件路径 根据扩展名选择上述对应方式
步骤2:提取6类关键信息 使用方法:读取 references/extraction_prompt.md 文件,获取完整的提取提示词模板。 执行步骤: 读取 references/extraction_prompt.md 文件内容 将招标文件内容插入到模板的 [在此插入招标文件文本内容] 位置 使用填充后的提示词模板进行信息提取 按照模板中的表格格式输出6类关键信息 提取的6类信息: 资格审查项 废标项/取消资格项 评分标准得分项/加分项 技术要求 装订要求 格式要求 重要:凡涉及"废标"、"取消资格"、"投标作废"、"投标文件作废"、"无效标"等描述的条款,均应列入废标项 必须添加PDF原始页码标注(格式:P5、P9-10)
步骤3:生成Markdown报告(中间格式) 将提取的6类信息整合为一个完整的Markdown文档,包含: 报告标题:# 招标文件解析报告 项目基本信息(项目名称、编号、解析日期、招标人、集采机构) 6个章节,每章为一个表格 必须添加PDF原始页码标注(如:P5、P9-10) 总结和建议(可选) 保存为Markdown文件: 文件名:招标文件解析报告_[项目名称]_[YYYYMMDD].md 保存路径:[workspace]/(工作空间根目录) 如无法获取项目名称,使用 招标文件解析报告_未知项目_[YYYYMMDD].md
步骤4:生成DOCX报告(必须执行) 执行方式:使用Python脚本 scripts/md_to_docx.py 将Markdown报告转换为DOCX格式。 重要:此步骤为必须执行步骤,DOCX格式为默认输出格式。 执行命令: cd "[workspace]" py scripts/md_to_docx.py "招标文件解析报告_XXX_YYYYMMDD.md" "招标文件解析报告_XXX_YYYYMMDD.docx" 输入输出: 输入:[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].md 输出:[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].docx 格式规范: 详细格式规范参见 references/report_format.md 全文微软雅黑字体 表格:深蓝色表头(#2E5496)、黑色边框、无首行缩进 自动清理LaTeX公式 页码标注格式:P4、P9-15 注意: [workspace] 为当前会话的工作空间路径(如 e:/000 Skills/招标文件解析) 如Markdown报告中无页码标注,DOCX表格中"页码"列留空
工具和依赖 PDF文件解析 必须使用带页码的工具 工具 路径 说明 extract_pdf_with_pages.py scripts/extract_pdf_with_pages.py 基于pdfplumber,保留页码,优先使用 @pdf skill — 禁止使用(无法保留页码) DOCX报告生成 工具 路径 说明 md_to_docx.py scripts/md_to_docx.py 核心转换脚本,已修复字体/表格问题 validate_and_fix_md.py scripts/validate_and_fix_md.py MD格式检查与自动修复 auto_convert.py scripts/auto_convert.py 一键格式检查+转换 DOCX文件解析 @docx skill 或 Markdown Converter skill Python依赖 pdfplumber # PDF解析 python-docx # DOCX生成 参考文档 references/extraction_prompt.md:提取提示词模板 references/report_format.md:报告格式规范
注意事项 大文件处理:如招标文件超过字数限制,可分段解析后整合 表格合并:如同一类信息分散在文件多个位置,应合并到同一表格 歧义处理:如条款理解有歧义,应在备注中说明 更新记录:如用户后续补充信息,可更新报告并注明更新日期 文件路径说明 [workspace]:当前会话工作空间根目录 当前项目:e:/000 Skills/招标文件解析 scripts/:可执行脚本目录(位于 .workbuddy/skills/bidding-document-parser/scripts/) references/:模板和格式规范文档 所有输出文件默认保存到 [workspace]/ 目录