📦 Zhihu Keyword Content Search — 知乎关键词内容爬取

v1.0.0

爬取知乎问题和回答,支持按关键词搜索、按回答数排序,输出 JSON 和纯文本。用于需要获取知乎特定主题数据的场景。

0· 128·0 当前·0 累计
by @taiyuexiao·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/1
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能实现了知乎关键词爬虫的功能,其代码、指令和要求一致。主要风险在于需要用户提供完整的知乎登录 Cookie(敏感信息),这对功能实现是必要的。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/1

知乎爬虫技能的初始发布。- 启用按关键词搜索知乎问题和爬取相关回答。- 支持按回答数排序问题。- 以 JSON 和纯文本格式保存结果以便分析。- 提供简单的命令行使用,用户提供 Cookie。- 处理常见错误并提供故障排除指南。

无害

安装命令

点击复制
官方npx clawhub@latest install zhihu-keyword-content-search
🇨🇳 镜像加速npx clawhub@latest install zhihu-keyword-content-search --registry https://cn.longxiaskill.com

技能文档

环境要求

  • Python 3.7+(pythonpython3 命令)
  • 依赖:pip install requests

工作流程

  • 识别关键词:从用户请求中提取要搜索的关键词
  • 获取 Cookie:若用户未提供,告知获取方式(见下方)
  • 执行脚本:运行 zhihu_crawl.py,监控进度
  • 汇报结果:问题数、回答数、输出目录

获取 Cookie

浏览器打开 zhihu.com 登录 → F12 → Network → 任意请求 → Request Headers → 复制 cookie: 后的完整值

执行命令

python zhihu_crawl.py 
  --cookie "用户的Cookie" 
  --keywords "关键词1" "关键词2" 
  --top 100 
  --output ./zhihu_output
Windows PowerShell:
python zhihu_crawl.py  
  --cookie "用户的Cookie"  
  --keywords "关键词1" "关键词2"  
  --top 100  
  --output ./zhihu_output
Windows 上若提示 SSL 错误,在命令前加:
$env:PATH = "C:\python\anaconda\Library\bin;" + $env:PATH

参数

参数必填默认值说明
--cookie知乎登录 Cookie
--keywordsMyGO Ave Mujica 丰川祥子搜索词,多个用空格分隔,含空格的词用引号
--top100取回答数最多的前 N 个问题
--outputzhihu_output输出目录路径
--search-max200每个关键词最多搜索多少候选

输出文件

``output/ ├── question_{id}.json # 每道题的完整数据(含全部回答) ├── _question_list.json # 问题列表(按回答数降序) └── _merged_all.txt # 所有内容合并纯文本(可直接喂给 AI 分析)

常见错误

错误原因解决
SSL module not availableAnaconda PATH 未配置设置 $env:PATH = "C:\python\anaconda\Library\bin;" + $env:PATH
ModuleNotFoundError: requests未安装依赖pip install requestspip install --user requests
HTTP 403Cookie 失效重新从浏览器复制 Cookie
找到 0 个问题Cookie 失效或关键词无结果检查 Cookie 是否完整有效

使用示例

抓取单主题:
bash python zhihu_crawl.py --cookie "abc..." --keywords "高松灯" --top 50 --output ./output_灯
抓取多主题,取 TOP 200:
bash python zhihu_crawl.py --cookie "abc..." --keywords "MyGO" "Ave Mujica" "丰川祥子" --top 200
``

数据来源:ClawHub ↗ · 中文优化:龙虾技能库