安全扫描
OpenClaw
安全
medium confidence该包是一个自包含的小红书网页爬虫,其代码和运行指令与描述的爬取目的相符,但会收集和存储会话Cookie,并可配置代理——因此,请谨慎处理这些敏感工件。
评估建议
此技能看起来像它所声称的:一个基于Playwright的小红书爬虫。安装/运行前重要注意事项:1) get-cookie.js 提取您的账户会话Cookie并以明文保存到config.json中——如果担心泄露或违反平台规则,请不要使用主要/个人账户;2) 运行前审查config.json —— 它可能包含代理凭证和存储的Cookie;3) 安装依赖项(playwright)将下载浏览器二进制文件;如果希望限制暴露,请在沙盒环境中运行npm install;4) 工具包括反检测和代理轮换功能;激进或大规模爬取可能违反网站条款并可能导致账户暂停——遵循SKILL.md中记录的使用限制;5) 如果需要更高的保证,请请求显示这里缺失的文件(4个文件被截断)并在运行于敏感账户前确认没有隐藏的网络数据外泄。...详细分析 ▾
✓ 用途与能力
名称/描述(小红书爬虫)与包含的脚本和库一致:基于Playwright的浏览器自动化、搜索/深度爬取/获取笔记/获取用户/热门笔记脚本、反爬逻辑和缓存。依赖项(playwright、axios、cheerio)和反爬代码的存在是此用途的预期。
⚠ 指令范围
SKILL.md和脚本指示代理/用户打开浏览器、捕获会话Cookie并写入config.json;脚本读取config.json,使用Cookie访问仅登录可访问的内容,并写入输出文件和缓存。收集和持久化会话Cookie是敏感的,超出了‘纯只读’行为——对于登录爬取是必要的,但应向用户强调。
ℹ 安装机制
注册表条目中没有明确的安装规格(仅指令),但package.json列出了Playwright,它将拉取浏览器二进制文件,并在安装依赖项时增加磁盘/网络活动。提供的文件中没有来自未知临时URL或混淆安装程序的下载。
⚠ 凭证需求
技能不请求环境变量或外部凭证,这是合理的。然而,它要求用户导出和存储他们的小红书会话Cookie(并且config可能包含代理服务器凭证)到本地的config.json中以明文形式;这是敏感的,应如此对待。请求的项目的数量/性质对于一个爬虫来说是合理的,但仍然与安全相关。
✓ 持久化与权限
技能未标记为always:true,并且不修改其他技能或全局代理设置。它在自己的工作空间中写入/读取自己的config.json和缓存文件,这对于一个CLI爬虫来说是正常的。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.12026/3/16
优化SKILL.md结构,添加YAML前置元数据,整理references文档
● 无害
安装命令 点击复制
官方npx clawhub@latest install xiaohongshu-crawler
镜像加速npx clawhub@latest install xiaohongshu-crawler --registry https://cn.clawhub-mirror.com
技能文档
小红书(Xiaohongshu)内容爬取工具,支持搜索、笔记详情、用户信息等公开内容的获取。
描述
小红书内容爬取工具,支持搜索笔记(需要登录)、获取笔记详情、用户信息、热门笔记等公开内容爬取功能。使用场景:
- 搜索特定关键词的笔记
- 获取单条笔记的详细内容
- 获取用户公开信息
- 获取热门笔记列表
- 批量深度爬取并生成分析报告
注意: 本工具仅限学习和研究使用,必须遵守小红书用户协议和相关法律法规。
安装
``bash
clawhub install xiaohongshu-crawler
` 快速配置
1. 获取 Cookie(搜索功能必需)
`bash
node scripts/get-cookie.js
`
按提示扫码登录后输入 save 即可。 2. 测试 Cookie
`bash
node scripts/test-cookie.js
`
显示 "✅ Cookie 有效" 即可使用。 核心用法
快速搜索
`bash
node scripts/quick-search.js "关键词" [数量]
` 深度爬取
`bash
node scripts/deep-crawl.js "关键词" [数量]
`
生成详细内容和 Markdown 分析报告。 其他功能
`bash
node scripts/get-note.js "笔记 ID" # 获取笔记详情
node scripts/get-user.js "用户 ID" # 获取用户信息
node scripts/hot-notes.js # 获取热门笔记
` 详细文档
- 完整使用指南 →
references/USAGE.md
使用示例 → references/examples.md
故障排查 → references/TROUBLESHOOTING.md 脚本说明
| 脚本 | 功能 | 需要登录 |
|------|------|---------|
| get-cookie.js | 交互式获取 Cookie | - |
| test-cookie.js | 测试 Cookie 有效性 | - |
| quick-search.js | 快速搜索笔记 | ✅ |
| deep-crawl.js | 深度爬取笔记详情 | ✅ |
| get-note.js | 获取单条笔记详情 | ✅ |
| get-user.js | 获取用户信息 | ✅ |
| hot-notes.js | 获取热门笔记 | 可选 | 使用规范
合规使用
- ✅ 允许: 个人学习研究、公开内容爬取、小批量数据(<50 条/次)
- ❌ 禁止: 商业用途、大规模高频爬取、私人内容、绕过付费、分发数据
反爬保护
- 默认随机延迟 2-8 秒
- 每分钟最多 10 个请求
- 模拟人类浏览行为
---
详细配置和故障排查请查看
references/` 目录下的文档。数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制