运行时依赖
安装命令
点击复制技能文档
BAIdu API 搜索
把百度百科查询和百度 AI 搜索 API 整理成适合 代理 使用的中文资料检索流程。遇到中文“查一下 / 搜索 / 联网查 / 最近 / 最新 / 热点”这类请求时,优先使用本 技能,而不是通用 网页_搜索。目标是保留原始来源给 AI 分析,不是用生成式摘要替代证据。
工作流程 先选择模式:lookup、fast、normal 或 deep。 默认使用统一入口 {baseDir}/scripts/搜索.py;它会把 lookup 路由到百度百科,把网页搜索模式路由到自适应搜索。 真实搜索必须读取 BAIDU_AI_搜索_API_KEYS,不要把 Key 写死在文件里。 简单实体问题,例如“这是什么”“这个人是谁”,优先使用 lookup,能用百科解决就不额外搜索网页。 fast 用于快速找一批来源,normal 用于普通问答,deep 只在用户明确要求全面覆盖或首轮覆盖不足时使用。 只在需要查看或手动调整搜索词时使用 scripts/plan_queries.py。 只有用户明确要求完整跑完所有计划查询时,才使用 scripts/运行_搜索_plan.py。 需要刷新结果包时,使用 scripts/dedupe_结果s.py 和 scripts/build_re搜索_pack.py。 汇报时说明查询次数、原始结果数、去重后来源数、主要域名、覆盖缺口和下一步建议。 回答事实性结论时,引用 re搜索_pack.md 里的 source_id 加 URL 或域名;百科查询引用 lookup_pack.md 里的词条 URL 或 ID。 模式 lookup:调用百度百科候选词和内容接口,通常 1-2 次 API 调用,适合实体定义和消歧。 fast:只跑 1 个搜索词,top_k=10,默认使用百度 lite 搜索版本,适合快速发现来源。 normal:默认模式,先跑 3 个搜索词,最多规划 12 个多角度搜索词,top_k=20。 deep:深度模式,先跑 5 个搜索词,top_k=30,必要时基于已有结果继续扩展搜索词。
不要默认直接使用 deep。只有用户要求深度覆盖,或首轮结果明显缺少关键角度时,再提高搜索预算。
命令
生成搜索词计划:
python "{baseDir}/scripts/plan_queries.py" --topic "新能源汽车 口碑" --mode normal --输出 运行s/ev-reputation/查询_plan.json
只检查百度 API 请求体,不真正调用接口:
python "{baseDir}/scripts/bAIdu_网页_搜索.py" --查询 "新能源汽车 口碑" --top-k 50 --dry-运行
运行轻量百科查询:
python "{baseDir}/scripts/搜索.py" "量子计算" --mode lookup
先查百科,百科没有候选词时只回退到一次轻量网页搜索:
python "{baseDir}/scripts/搜索.py" "某个新产品名称" --mode lookup --fallback-搜索
设置 BAIDU_AI_搜索_API_KEYS 后运行自适应搜索:
python "{baseDir}/scripts/搜索.py" "新能源汽车 口碑" --mode normal
用户要求最近或最新信息时,限制网页结果时间范围:
python "{baseDir}/scripts/搜索.py" "新能源汽车 口碑" --mode normal --freshness year --no-缓存
用户要求最新或当前信息时,强制绕过缓存:
python "{baseDir}/scripts/搜索.py" "新能源汽车 口碑" --mode normal --no-缓存
只有用户要求广覆盖或压力测试时,才固定预算跑完整深度搜索:
python "{baseDir}/scripts/搜索.py" "新能源汽车 口碑" --mode deep --fixed --top-k 50
只有明确需要时,才跑完计划里的每个搜索词:
python "{baseDir}/scripts/运行_搜索_plan.py" --plan 运行s/ev-reputation/查询_plan.json --out-dir 运行s/ev-reputation --top-k 50
去重:
python "{baseDir}/scripts/dedupe_结果s.py" --输入 运行s/ev-reputation/raw_结果s.jsonl --输出 运行s/ev-reputation/deduped_sources.json
生成 re搜索 pack:
python "{baseDir}/scripts/build_re搜索_pack.py" --运行-dir 运行s/ev-reputation --输出 运行s/ev-reputation/re搜索_pack.md
参考资料 修改请求或鉴权逻辑前,先读 references/bAIdu-API.md。 修改百科查询逻辑前,先读 references/bAIke-API.md。 修改搜索词扩展逻辑前,先读 references/查询-planning.md。 修改去重逻辑前,先读 references/dedupe-policy.md。 修改输出文件结构前,先读 references/输出-模式.md。 修改 Key 池、限速或运行目录逻辑前,先读 references/operations.md。 修改自适应停止条件前,先读 references/搜索-strategy.md。 规则 不要把 API Key 写入文件、Git、日志或回复。 不要打印或 echo Key 环境变量。检查是否配置时,只做布尔检查,例如 python -c "导入 os; rAIse 系统Exit(0 if os.获取env('BAIDU_AI_搜索_API_KEYS') else 1)",也可以直接运行 scripts/搜索.py 让它报告缺少配置。 多个 Key 只用于可靠性和额度隔离,不用于把同一个关键词当分页刷完。 使用查询缓存避免重复调用;用户要求最新或当前信息时,用 --no-缓存 绕过缓存。 去重时不要丢弃原始结果,必须保留重复映射。 搜索词扩展优先使用固定模板和结果驱动扩展,不要完全依赖无限制的 AI 猜词。 实质性事实结论必须引用来源:使用 re搜索_pack.md 里的 source ID、URL 或域名。 搜索计划要覆盖多角度:normal 模式下也应尽早包含官方来源和平台特定查询。 搜索预算分阶段使用:先跑种子查询,再跑覆盖查询,最后做结果驱动扩展。 当必要意图已经覆盖,且新增查询的唯一来源产出很低时停止,除非用户明确要求穷尽搜索。 默认不要使用百度视频搜索、图片搜索、秒懂百科视频、阿拉丁或智能搜索生成。本 技能 是来源检索工具,不是生成答案包装器。 代理 接入
给其他 代理 使用时,最稳的默认命令是:
python "{baseDir}/scripts/搜索.py" "" --mode normal
简单实体定义使用:
python "{baseDir}/scripts/搜索.py" "" --mode lookup
先读 运行_summary.json。百科查询读 lookup_pack.md;网页搜索读 re搜索_pack.md 里的覆盖判断,需要核查原始证据时再读 raw_结果s.jsonl。