📦 Ecommerce Scraper — 电商动态网站爬虫
v1.0.0基于Playwright的电商网站数据爬虫,支持JavaScript渲染页面、Cloudflare反爬、隐藏API发现和分页抓取。适用于京东、淘宝、拼多多、Amazon、eBay等电商平台的数据采集、价格监控和竞品分析。
1· 1.6k·13 当前·13 累计
安全扫描
OpenClaw
安全
medium confidence该技能代码与其声明目的一致(使用Playwright的电商爬虫,发现隐藏API、分页抓取、绕过基本的bot检查和管理登录cookie)。包中没有指示隐秘数据泄露或不相关的权限,但存在小BUG和操作/伦理风险。
评估建议
该包看似是一致的电商爬取工具,但安装前请考虑:(1)法律/伦理:绕过Cloudflare/反bot措施和爬取某些网站可能违反服务条款或法律——确认您有权限;(2)依赖项:必须安装Playwright和浏览器运行时;(3)cookies和登录:`scrape_v2` 保存cookies到 `data/cookies.json` —— 将该文件视为敏感信息;(4)代码质量:存在小BUG;(5)操作:在隔离环境中运行,监控网络访问。...详细分析 ▾
✓ 用途与能力
名称/描述(基于Playwright的电商爬虫)与包含的脚本和SKILL.md一致:代码实现了JS渲染爬取、隐藏API发现、分页、Cloudflare规避技巧和登录/cookie处理。没有不相关的服务、凭据或二进制文件被请求。
ℹ 指令范围
指令明确指示代理运行Playwright加载页面、监听网络响应发现API端点、注入反检测脚本、保存/加载cookies。这些行为适合爬取,但包括规避保护的主动措施(Cloudflare绕过技术和自动化隐身脚本),这扩大了范围并可能有法律/伦理影响。SKILL.md没有指示读取不相关的本地文件或将数据发送到第三方端点。
✓ 安装机制
没有安装规格(仅指令和Python脚本)。这降低了安装器风险;然而,代码依赖于Playwright和浏览器运行时,README和脚本指出用户必须安装(使用pip install playwright && playwright install chromium)。没有嵌入外部任意下载或晦涩的安装程序。
✓ 凭证需求
该技能不请求环境变量或凭据。支持登录的脚本使用交互式QR/登录流并将cookies存储到本地文件(data/cookies.json),这与其声明的功能集成相称。没有请求不相关的秘密或配置路径。
✓ 持久化与权限
always为false,该技能不尝试修改其他技能或全局代理设置。它仅在data/目录下持久化自己的cookies/本地文件。默认允许自主调用(平台默认),但不与其他高风险指标结合。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/2/26
电商爬虫初始发布 - 支持动态电商网站数据爬取、Cloudflare反爬、隐藏API发现和分页抓取。适用于中国和国际电商平台。提供基本爬取、登录启用爬取、API发现和Cloudflare绕过脚本。
● 可疑
安装命令
点击复制官方npx clawhub@latest install ecommerce-scraper
镜像加速npx clawhub@latest install ecommerce-scraper --registry https://cn.longxiaskill.com
技能文档
# 电商动态网站爬虫技能,基于Playwright处理JavaScript渲染。 ## 快速开始 ... (中间内容保持原样,不翻译) ... ## 输出格式 爬取结果可保存为: ``json [ { "title": "商品名称", "price": "¥99.00", "shop": "店铺名", "link": "https://...", "image": "https://...", "collected_at": "2026-02-26T15:00:00Z" } ] ``