加载中…

Scrape — 网页抓取

v1.1.0

合法的网页抓取工具，支持 robots.txt 合规、速率限制，以及 GDPR/CCPA 数据处理。支持直接 HTTP 抓取和托管抓取方式。

0· 0·0 当前·0 累计

by @alvisdunlop

生产力工具

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install alvisdunlop-scrape

镜像加速npx clawhub@latest install alvisdunlop-scrape --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

概述

Scrape 是一个合法的网页抓取技能，支持 robots.txt 合规、速率限制，以及 GDPR/CCPA 数据处理。

功能特性

robots.txt 合规检查
速率限制
GDPR/CCPA 数据处理支持
直接 HTTP 抓取
托管抓取方式

使用方法

# 基本用法
scrape --url https://example.com

配置选项

rate_limit: 每秒请求数限制
user_agent: 自定义 User-Agent
respect_robots_txt: 是否遵守 robots.txt

相关技能推荐

Self-Improving + Proactive Agent - 自我改进和主动代理

该技能通过自我反思、自我批评、自我学习来持续改进代理的工作表现，能够从用户纠正、自我反思和学习信号中学习和改进

Himalaya — 终端邮件管理

在终端用 IMAP/SMTP 收发邮件：列出、阅读、撰写、回复、转发、搜索与归档，支持多账号与 MML 语法，一键管理收件箱。

Apple Notes - Apple 笔记管理工具

通过 `memo` CLI 在 macOS 终端管理 Apple Notes，支持创建、查看、编辑、删除、搜索、移动及导出等基本操作。

Sag - ElevenLabs 语音合成工具

基于 ElevenLabs 的文本转语音服务，提供类似 macOS say 的命令行交互体验，支持本地播放、语音模型切换、标签化情感控制等功能。

Clawdbot Documentation Expert - Clawdbot 文档专家，提供决策树导航、搜索脚本、文档获取、版本追踪及配置片段

Clawdbot 文档专家技能，支持决策树式导航、站点地图、关键词及全文搜索、文档抓取、版本追踪以及常用配置片段，帮助国内开发者快速定位并配置 Clawdbot 各项功能。

API Gateway — 百款API一站调用

通过托管OAuth一键接入Google Workspace、Microsoft 365、GitHub、Notion、Slack、Airtable、HubSpot等100+主流API，无需手写鉴权代码，用Maton API Key即可代理请求、管理连接，让多平台集成像拼积木一样简单。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库