加载中…

Crawl By Desearch — 网页内容爬取

v1.0.1

爬取/抓取任意网页 URL 的内容，提取并返回清洁文本或原始 HTML。适用于需要读取完整网页内容的场景。

1· 771·4 当前·5 累计

使用场景：使用Crawl By Desearch — 网页内容爬取进行数据与API使用Crawl By Desearch — 网页内容爬取

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install desearch-crawl

镜像加速npx clawhub@latest install desearch-crawl --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Crawl By Desearch — 网页内容爬取安装说明：安装命令：["openclaw skills install desearch-crawl"] 支持国内镜像加速，使用 --registry https://cn.longxiaskill.com 参数可加速下载

需要定制？告诉我你的需求 →

技能文档

简介

爬取任意网页 URL 的内容，返回清洁文本或原始 HTML。

用法

输入目标 URL
选择返回格式（清洁文本/原始 HTML）
执行爬取

代码示例

crawl-by-desearch https://example.com -f text

注意

请确保有权爬取目标网站
避免高频率爬取

相关技能推荐

self-improving-agent — 自我改进代理

捕获学习成果、错误和修正以实现持续改进。适用于命令/操作失败、用户纠正AI、请求新功能、API/工具失败、知识过时或发现更好方法等场景。

Weather — 实时天气和预报

获取当前天气和预报，无需 API 密钥。通过 wttr.in 和 Open-Meteo 使用 curl 获取天气信息，不需要安装软件或提供凭据。

Gog — Google Workspace CLI — Gog工具

Gog 是一个 Google Workspace 的命令行接口（CLI），支持 Gmail、日历、Drive、联系人、表格和文档的操作。它允许用户通过命令行管理 Google 服务，包括发送邮件、创建事件、文件管理等。需要配置 OAuth 凭据以授权访问。

Proactive Agent — 主动智能代理

将 AI 代理从被动任务执行者转变为主动合作伙伴，能够预测需求并持续改进。该技能包含 WAL 协议、工作缓冲区、自治定时任务和经过实战验证的模式，属于 Hal Stack 生态。

Obsidian — 笔记库自动化

通过 obsidian-cli 操作 Obsidian 笔记库（纯 Markdown 笔记），支持创建、移动、删除笔记等自动化操作。

Notion — 笔记管理

Notion 笔记和知识库管理工具，支持文档创建、数据库和项目管理。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库