📦 搜索网页规则管理(多平台增强版) — Web Search Rule Management(Multi-Platform Enhanced Edition)
v2.0.0搜索網頁時的規則管理技能。支持多種知識庫平台(IMA、騰訊文檔、其他),自動管理搜索網址庫(白名單、黑名單、未分類),暫存搜索內容,並在用戶確認後整理歸檔。當用戶提到搜索網頁、網址規則、白名單、黑名單、暫存搜索內容時使用此技能。
运行时依赖
安装命令
点击复制技能文档
Web Search Rules Skill 是一種搜尋網頁時的規則管理技能,實現智能的網址過濾和內容管理流程。支持多種知識庫平台,讓用戶自由選擇。
核心功能 多平台支持:支持 IMA 知識庫、騰訊文檔、或其他知識庫平台 網址庫管理:維護「搜尋網址庫」,記錄白名單、黑名單和未分類網址 內容暫存:使用「未整理搜尋內容」暫存搜尋結果 智能過濾:根據白名單/黑名單自動過濾搜尋結果 用戶確認:對新網址諮詢用戶意見後再決定分類 內容歸檔:將確認的內容整理並保存到目標知識庫
知識庫平台選擇 支持的平台 IMA 知識庫 (ima) 使用 ima-skill 進行操作 適合:需要 AI 搜索、知識圖譜的場景 功能:筆記管理、知識庫操作、文件上傳 騰訊文檔 (tencent-docs) 使用 tencent-docs skill 進行操作 適合:需要協作編輯、在線預覽的場景 功能:在線文檔、智能表格、思維導圖 Obsidian (obsidian) 使用文件系統直接操作(推薦)或 Obsidian Local REST API 插件 適合:本地化知識管理、Markdown 原生支持、雙向鏈接 功能:Markdown 編輯、雙向鏈接、標籤系統、本地存儲 操作方式: 方案 A:直接操作 Vault 文件夾(更簡單、無依賴) 方案 B:通過 Obsidian Local REST API 插件(需要安裝插件) NotebookLM (notebooklm) 使用瀏覽器自動化(playwright-cli 或 agent-browser)進行操作 適合:需要 AI 輔助分析的場景、Google 生態系統用戶 功能:AI 摘要、自動問答、來源管理、Google Drive 集成 操作方式: 方案 A:瀏覽器自動化(推薦,使用 playwright-cli 或 agent-browser) 方案 B:通過 Google Drive API 間接集成(NotebookLM 可以導入 Drive 文件) 其他平台 (custom) 用戶自定義平台 需要提供 API 或操作方式
平台選擇流程 在用戶首次使用時,詢問並記錄用戶的知識庫平台偏好: 詢問用戶: 「請問您想要使用哪個平台來管理搜尋規則和內容?」 選項:
- IMA 知識庫(推薦)- 支持 AI 搜索和知識圖譜
- 騰訊文檔 - 支持協作編輯和在線預覽
- Obsidian - 本地化 Markdown 知識管理,支持雙向鏈接
- NotebookLM - Google AI 輔助研究工具
- 其他平台 - 請指定平台名稱和操作方式
~/.workbuddy/skills/web-search-rules/config.json前置準備 檢查並創建必要知識庫 根據用戶選擇的平台,檢查並創建兩個知識庫: 搜尋網址庫 (search-url-library) 用途:記錄搜尋規則、網址的暫存名單(未分類白名單還是黑名單)、白名單和黑名單 結構: 白名單/ 網址1 網址2 ... 黑名單/ 網址1 網址2 ... 未分類/ 網址1 網址2 ... 未整理搜尋內容 (unorganized-search-content) 用途:暫存搜尋後的網頁內容 結構:按搜尋日期組織 2026-05-05/ 網頁標題1.md 網頁標題2.md ... 平台特定操作: IMA 知識庫:使用 ima-skill 檢查並創建 騰訊文檔:使用 tencent-docs skill 檢查並創建 Obsidian: 方案 A(推薦):直接在 Vault 文件夾中創建文件夾和文件 方案 B:通過 Obsidian Local REST API 插件操作 需要先安裝並啟用 Obsidian Local REST API 插件 使用 HTTP API 創建、讀取、更新筆記 NotebookLM: 方案 A(推薦):使用瀏覽器自動化(playwright-cli 或 agent-browser) 自動登錄 Google 帳號 上傳文件或添加網頁鏈接 等待 AI 處理完成 方案 B:通過 Google Drive API 間接集成 將文件上傳到 Google Drive 在 NotebookLM 中導入 Drive 文件 其他平台:根據用戶提供的操作方式進行
搜尋工作流程 步驟 1:解析搜尋請求 從用戶請求中提取: 搜尋關鍵詞 目標知識庫(內容最終要保存到的知識庫) 知識庫平台(從配置文件讀取或用戶指定) 其他搜尋參數(時間範圍、來源等) 步驟 2:載入網址庫 根據用戶選擇的平台,從「搜尋網址庫」中讀取: 白名單列表 黑名單列表 未分類列表 如果無法讀取或文件不存在,提示用戶並協助創建。 步驟 3:執行搜尋 使用適當的搜尋工具(如 wechat-article-search、web_search、web_fetch 等)執行搜尋。 步驟 4:過濾搜尋結果 對每個搜尋結果進行分類: 對於每個搜尋結果:
- 提取網址
- 如果網址在白名單中: → 標記為「自動通過」
- 如果網址在黑名單中: → 標記為「自動過濾」,跳過
- 如果網址在未分類中或不在任何列表中: → 標記為「待確認」
- 發布時間:
- 來源:
- 狀態:待確認 / 自動通過
- 搜尋關鍵詞:
內容摘要
完整內容
步驟 6:諮詢用戶 列出所有「待確認」的網頁,向用戶展示: 找到 個新網址需要確認: ... 請問:- 哪些網址應該加入白名單?(可以直接保存內容)
- 哪些網址應該加入黑名單?(以後搜尋時自動過濾)
- 哪些網址的內容需要保存?(保存到目標知識庫)