Baidu API Search — BAIdu API 搜索

v1.0.3

面向代理的百度 API 搜索技能。用于中文“查一下/搜索/联网查/最近/最新/热点”等场景，调用百度百科和百度 AI 搜索 API，保留原始结果、去重并生成 re搜索 pack。

0· 0·0 当前·0 累计

by @valenovo (Valen)·MIT-0

API开发网络工具浏览器自动化 AI模型访问

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install baidu-api-search

镜像加速npx clawhub@latest install baidu-api-search --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

BAIdu API 搜索

把百度百科查询和百度 AI 搜索 API 整理成适合代理使用的中文资料检索流程。遇到中文“查一下 / 搜索 / 联网查 / 最近 / 最新 / 热点”这类请求时，优先使用本技能，而不是通用网页_搜索。目标是保留原始来源给 AI 分析，不是用生成式摘要替代证据。

工作流程先选择模式：lookup、fast、normal 或 deep。默认使用统一入口 {baseDir}/scripts/搜索.py；它会把 lookup 路由到百度百科，把网页搜索模式路由到自适应搜索。真实搜索必须读取 BAIDU_AI_搜索_API_KEYS，不要把 Key 写死在文件里。简单实体问题，例如“这是什么”“这个人是谁”，优先使用 lookup，能用百科解决就不额外搜索网页。 fast 用于快速找一批来源，normal 用于普通问答，deep 只在用户明确要求全面覆盖或首轮覆盖不足时使用。只在需要查看或手动调整搜索词时使用 scripts/plan_queries.py。只有用户明确要求完整跑完所有计划查询时，才使用 scripts/运行_搜索_plan.py。需要刷新结果包时，使用 scripts/dedupe_结果s.py 和 scripts/build_re搜索_pack.py。汇报时说明查询次数、原始结果数、去重后来源数、主要域名、覆盖缺口和下一步建议。回答事实性结论时，引用 re搜索_pack.md 里的 source_id 加 URL 或域名；百科查询引用 lookup_pack.md 里的词条 URL 或 ID。模式 lookup：调用百度百科候选词和内容接口，通常 1-2 次 API 调用，适合实体定义和消歧。 fast：只跑 1 个搜索词，top_k=10，默认使用百度 lite 搜索版本，适合快速发现来源。 normal：默认模式，先跑 3 个搜索词，最多规划 12 个多角度搜索词，top_k=20。 deep：深度模式，先跑 5 个搜索词，top_k=30，必要时基于已有结果继续扩展搜索词。

不要默认直接使用 deep。只有用户要求深度覆盖，或首轮结果明显缺少关键角度时，再提高搜索预算。

命令

生成搜索词计划：

python "{baseDir}/scripts/plan_queries.py" --topic "新能源汽车口碑" --mode normal --输出运行s/ev-reputation/查询_plan.json

只检查百度 API 请求体，不真正调用接口：

python "{baseDir}/scripts/bAIdu_网页_搜索.py" --查询 "新能源汽车口碑" --top-k 50 --dry-运行

运行轻量百科查询：

python "{baseDir}/scripts/搜索.py" "量子计算" --mode lookup

先查百科，百科没有候选词时只回退到一次轻量网页搜索：

python "{baseDir}/scripts/搜索.py" "某个新产品名称" --mode lookup --fallback-搜索

设置 BAIDU_AI_搜索_API_KEYS 后运行自适应搜索：

python "{baseDir}/scripts/搜索.py" "新能源汽车口碑" --mode normal

用户要求最近或最新信息时，限制网页结果时间范围：

python "{baseDir}/scripts/搜索.py" "新能源汽车口碑" --mode normal --freshness year --no-缓存

用户要求最新或当前信息时，强制绕过缓存：

python "{baseDir}/scripts/搜索.py" "新能源汽车口碑" --mode normal --no-缓存

只有用户要求广覆盖或压力测试时，才固定预算跑完整深度搜索：

python "{baseDir}/scripts/搜索.py" "新能源汽车口碑" --mode deep --fixed --top-k 50

只有明确需要时，才跑完计划里的每个搜索词：

python "{baseDir}/scripts/运行_搜索_plan.py" --plan 运行s/ev-reputation/查询_plan.json --out-dir 运行s/ev-reputation --top-k 50

去重：

python "{baseDir}/scripts/dedupe_结果s.py" --输入运行s/ev-reputation/raw_结果s.jsonl --输出运行s/ev-reputation/deduped_sources.json

生成 re搜索 pack：

python "{baseDir}/scripts/build_re搜索_pack.py" --运行-dir 运行s/ev-reputation --输出运行s/ev-reputation/re搜索_pack.md

参考资料修改请求或鉴权逻辑前，先读 references/bAIdu-API.md。修改百科查询逻辑前，先读 references/bAIke-API.md。修改搜索词扩展逻辑前，先读 references/查询-planning.md。修改去重逻辑前，先读 references/dedupe-policy.md。修改输出文件结构前，先读 references/输出-模式.md。修改 Key 池、限速或运行目录逻辑前，先读 references/operations.md。修改自适应停止条件前，先读 references/搜索-strategy.md。规则不要把 API Key 写入文件、Git、日志或回复。不要打印或 echo Key 环境变量。检查是否配置时，只做布尔检查，例如 python -c "导入 os; rAIse 系统Exit(0 if os.获取env('BAIDU_AI_搜索_API_KEYS') else 1)"，也可以直接运行 scripts/搜索.py 让它报告缺少配置。多个 Key 只用于可靠性和额度隔离，不用于把同一个关键词当分页刷完。使用查询缓存避免重复调用；用户要求最新或当前信息时，用 --no-缓存绕过缓存。去重时不要丢弃原始结果，必须保留重复映射。搜索词扩展优先使用固定模板和结果驱动扩展，不要完全依赖无限制的 AI 猜词。实质性事实结论必须引用来源：使用 re搜索_pack.md 里的 source ID、URL 或域名。搜索计划要覆盖多角度：normal 模式下也应尽早包含官方来源和平台特定查询。搜索预算分阶段使用：先跑种子查询，再跑覆盖查询，最后做结果驱动扩展。当必要意图已经覆盖，且新增查询的唯一来源产出很低时停止，除非用户明确要求穷尽搜索。默认不要使用百度视频搜索、图片搜索、秒懂百科视频、阿拉丁或智能搜索生成。本技能是来源检索工具，不是生成答案包装器。代理接入

给其他代理使用时，最稳的默认命令是：

python "{baseDir}/scripts/搜索.py" "" --mode normal

简单实体定义使用：

python "{baseDir}/scripts/搜索.py" "" --mode lookup

先读运行_summary.json。百科查询读 lookup_pack.md；网页搜索读 re搜索_pack.md 里的覆盖判断，需要核查原始证据时再读 raw_结果s.jsonl。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库