首页龙虾技能列表 › Miliger Playwright Scraper — 基于Playwright的网页爬取技能

Miliger Playwright Scraper — 基于Playwright的网页爬取技能

v1.2.0

使用Playwright进行真实浏览器操作,爬取复杂动态网页。支持多Tab、懒加载、SPA单页应用,适用于公开信息型网站,如会议议程、展会信息等。

0· 0·0 当前·0 累计
by @zhaog100·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/15
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能是一致的Playwright基于的网页爬取器:其指令、示例代码和要求与描述目的相符,没有未解释的凭据、网络端点或可疑安装步骤。
评估建议
该技能似乎做了它声称的(一个Playwright基于的爬取器)。在运行之前:(1)审查示例脚本;(2)使用新/短暂的浏览器配置文件;(3)仅指向公开、合法的页面;(4)在受控环境中运行npm install;(5)如果需要更强的保证,在可丢弃的VM/容器中运行并检查输出文件。...
详细分析 ▾
用途与能力
名称/描述描述了一个Playwright网页爬取器,SKILL.md及示例完全实现了该功能(Playwright API、导航、点击、滚动、数据提取、保存到磁盘)。没有无关的凭据、二进制文件或服务被请求。
指令范围
指令保持在爬取范围内(生成/运行Playwright脚本、提取DOM、保存Markdown/JSON)。它们包括可以捕获任意页面内容的操作(page.content()、截屏、保存HTML)并推荐持久的浏览器配置文件,这意味着如果运行在认证页面上,工具可以收集敏感信息。文档警告仅爬取公共数据,但重新使用配置文件和捕获完整页面内容的能力会增加误用风险。
安装机制
技能包中没有嵌入安装规范(仅指令)。README/SKILL.md 指示运行npm install playwright 和npx playwright install chromium — 标准、众所周知的步骤,将从官方源下载Playwright和浏览器二进制文件。包文件中没有任意下载URL或从未知主机提取的行为。
凭证需求
该技能不请求环境变量或外部凭据(没有列出秘密令牌)。然而,它推荐并演示了持久的Chrome配置文件(./chrome-profile),这些文件在磁盘上存储cookies/会话数据 — 这给了爬取器在用户提供的情况下重用身份验证状态的能力,因此用户应该避免将技能指向需要登录的网站,除非他们了解隐私影响。
持久化与权限
该技能没有标记为'always: true',使用正常的自主调用默认值。它将输出和配置文件数据写入本地目录(例如 ./mwc-agenda, ./chrome-profile),这对于一个爬取器来说是预期的;它不修改其他技能或系统范围的代理配置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.2.02026/3/15
● 无害

安装命令 点击复制

官方npx clawhub@latest install miliger-playwright-scraper
镜像加速npx clawhub@latest install miliger-playwright-scraper --registry https://cn.clawhub-mirror.com

技能文档

(由于原始内容中SKILL.md已提供中文版,以下为占位,请替换为实际内容或保持原文)请参考提供的中文SKILL.md文档。

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务