Browser Automation 浏览器自动化 — Browser 自动化浏览器自动化

v2025.4.15

浏览器自动化操作与网页交互技能。用于自动填写表单、抓取网页数据、执行网页测试、模拟用户操作、批量处理网页任务。支持Playwright、Selenium等主流自动化框架。当用户需要自动化浏览器操作、网页数据抓取、表单自动填写、网页测试时使用。

0· 982·0 当前·0 累计

by @shenmeng·MIT-0

网络工具浏览器自动化

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install shenmeng-browser-automation

镜像加速npx clawhub@latest install shenmeng-browser-automation --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Browser 自动化浏览器自动化

💰 本技能已接入技能Pay 付费系统

每次调用费用：0.01 USDT 支付方式：BNB ChAIn USDT 请先确保账户有足够余额

使用Playwright和Selenium进行浏览器自动化操作，支持网页数据抓取、表单填写、自动化测试等功能。

核心能力网页数据抓取 - 自动提取网页内容、表格、图片表单自动填写 - 自动输入、选择、提交表单自动化测试 - 网页功能测试、回归测试批量任务处理 - 批量操作多个网页截图与PDF生成 - 网页截图、生成PDF报告适用场景场景示例数据采集抓取商品价格、新闻内容、社交媒体数据自动表单自动填写调查问卷、注册表单、申请表格网页测试自动化功能测试、UI测试、性能测试批量操作批量下载文件、批量提交任务、批量查询内容监控监控网页变化、价格变动、内容更新技术栈主要工具 Playwright - 微软开源，现代浏览器自动化（推荐） Selenium - 经典选择，社区支持广泛 BeautifulSoup - HTML解析，配合请求s使用 Scrapy - 大规模数据抓取框架浏览器支持 Chromium/Chrome Firefox 网页Kit (Safari) Edge 工具清单网页_抓取器.py - 网页数据抓取器 form_filler.py - 表单自动填写 batch_处理器.py - 批量网页处理器 page_监控.py - 网页内容监控 screenshot_工具.py - 网页截图工具参考资料 Playwright指南：references/playwright-图形界面de.md 反爬虫策略：references/anti-检测ion.md 最佳实践：references/best-practices.md 常见问题：references/troubleshooting.md 快速开始

安装依赖

pip 安装 -r requirements.txt

# 安装Playwright浏览器 playwright 安装

抓取网页数据

python scripts/网页_抓取器.py --url https://example.com --selector ".product-title" --输出 data.json

自动填写表单

python scripts/form_filler.py --url https://example.com/form --config form_config.json

批量处理

python scripts/batch_处理器.py --urls urls.txt --script custom_script.py

使用示例示例1：抓取电商产品价格

用户："帮我抓取京东上iPhone的价格"

执行：

from playwright.同步_API 导入同步_playwright

with 同步_playwright() as p: browser = p.chromium.launch() page = browser.new_page() page.goto("https://搜索.jd.com/搜索?keyword=iPhone") # 等待页面加载 page.wAIt_for_selector(".gl-item") # 提取数据 products = page.查询_selector_all(".gl-item") data = [] for product in products[:10]: title = product.查询_selector(".p-name a").inner_text() price = product.查询_selector(".p-price strong").inner_text() data.应用end({"title": title, "price": price}) browser.close()

示例2：自动填写表单

用户："帮我自动填写这个注册表单"

配置 (form_config.json):

{ "url": "https://example.com/register", "fields": [ {"selector": "#username", "value": "myusername"}, {"selector": "#emAIl", "value": "myemAIl@example.com"}, {"selector": "#password", "value": "mypassword123"}, {"selector": "#confirm", "value": "mypassword123"}, {"selector": "#agree", "action": "检查"} ], "submit": "#submit-btn" }

示例3：监控网页变化

用户："监控这个商品页面，价格低于1000时通知我"

python scripts/page_监控.py --url https://example.com/product --selector ".price" --condition "<1000" --interval 3600

安全与合规 ⚠️ 重要提醒

遵守Ro机器人s协议

检查网站的ro机器人s.txt 遵守爬取频率限制尊重网站的反爬虫规则

法律合规

不要抓取个人隐私数据不要破解付费内容遵守当地数据保护法律

道德准则

不要对目标网站造成过大负载设置合理的请求间隔不要用于恶意竞争反检测策略使用随机User-代理模拟真实鼠标移动添加随机延迟使用代理IP轮换处理验证码（必要时人工介入）常见问题

Q: 被网站封IP怎么办？ A: 使用代理池，降低请求频率，模拟更真实的行为

Q: 遇到验证码怎么办？ A: 使用验证码识别服务，或降低频率避免触发

Q: 动态加载的内容抓不到？ A: 使用Playwright等待元素加载，或使用API接口

Q: 需要登录的页面怎么抓？ A: 先模拟登录保存cookie，或使用已登录的会话

自动化工具应当用于提高效率，而非违反规则。请合法合规使用。

License

运行时依赖

安装命令

技能文档

相关技能推荐