运行时依赖
安装命令
点击复制技能文档
Agent 注意:以下至第一条分隔线()的内容为人类阅读的 ClawHub 发布说明,请直接跳至 标签阅读并执行指令。 Agent note: The content below this line up to is human-readable ClawHub listing copy. Skip directly to for execution instructions. 知识检索 — 本地知识库检索 Skill 本地优先的文档搜索 Skill,为知识工作者和顾问提供服务。支持 PPT/PDF/DOCX 格式,使用关键词 + AI 双通道搜索,使用频率越高越智能。不需要上传到云端。 功能亮点 📄 支持真实文件格式 大多数搜索工具仅支持纯文本,忽略 PPT 和 PDF 文件。本 Skill 直接读取这些文件:PPTX(含嵌套图形和备注页)、PDF(双引擎兜底)、DOCX、XLSX、图片和所有文本格式。文件在原地处理,原始文件夹不受影响。非文本文件缓存存储在独立的工作目录中,不与原始文件夹混淆。 WPS 格式(.wps / .et / .dps):如果已保存为 Office 兼容格式,直接支持。原生 WPS 格式可通过 pip install pywpsrpc 启用(需安装 WPS Office)。 🏠 本地优先 原始文件、知识库索引和工作缓存存储在本地机器上,无需上传或存储在外部平台或云端。AI 进行语义分析时,从本地文件内容读取进行推理和回答。支持 OneDrive 等本地同步网盘,文件存储在同步盘中时,系统会自动下载。 🔄 动态更新 知识库每天都在变化,新文件加入、旧文件修改、过时文件删除。本 Skill 自动感知变化:新文件下次搜索自动发现,旧文件描述自动刷新,已删除文件自动从索引移除。不需要每次改完文件都重建整个索引。 🎯 关键词 + 自然语言 纯关键词搜索存在问题:同一个概念在不同文件中措辞不同。纯语义搜索需要维护向量库,容易跑偏。本 Skill 使用 AI 将搜索词扩展为最多 20 个同义词,然后交给轻量级关键词索引进行精确匹配。AI 语义通道再做一次判断兜底,两条通道合并输出。 📈 越用越聪明 传统搜索 Skill 初始化后索引质量就固定了,不会再提升。本 Skill 第一次搜索时只建最基础的索引。每次搜索到一个文件,AI 读完内容后提取 3-5 个关键词自动补充到文件描述中。长期效果:最常被搜索的文件描述最丰富,命中率最高;不常搜索的文件不浪费预处理时间;搜索习惯逐渐塑造出对你最友好的索引。搜索质量的天花板随使用次数持续抬升。 🔍 缓存透明化 索引和缓存不再是黑盒子。本 Skill 在原始文件夹和工作目录之间建立双向链接,随时可以打开查看索引列表、翻阅提取缓存或手动清理。 🛡️ 配置不全也能跑 无 PDF 库安装?搜索仍可运行,PDF 文件只是这次不会被找到。BM25 索引损坏?自动回退到纯 AI 语义匹配。无匹配文件?AI 诚实报告没有找到,不存在幻觉。每个失败路径都有定义的回退行为,不需要担心工具的缺陷。