📦 Crawl By Desearch — 网页内容爬取

v?

爬取/抓取任意网页 URL 的内容,提取并返回清洁文本或原始 HTML。适用于需要读取完整网页内容的场景。

1· 771·0 当前·0 累计
0

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install desearch-crawl
镜像加速npx clawhub@latest install desearch-crawl --registry https://cn.longxiaskill.com

技能文档

简介

爬取任意网页 URL 的内容,返回清洁文本或原始 HTML。

用法

  • 输入目标 URL
  • 选择返回格式(清洁文本/原始 HTML)
  • 执行爬取

代码示例

crawl-by-desearch https://example.com -f text

注意

  • 请确保有权爬取目标网站
  • 避免高频率爬取
数据来源ClawHub ↗ · 中文优化:龙虾技能库