clean-web-fetch — 获取干净网页内容
v1.0.0获取现代网页的干净、可读正文内容,支持微信公众号文章抓取、尾部噪音清洗,减少无用信息和token消耗。适用于新闻、博客、公告等网页,尤其是普通fetch不稳定或遇到反爬、动态渲染的场景。
0· 637·3 当前·3 累计
安全扫描
OpenClaw
可疑
high confidence该技能描述与网页内容提取工具匹配,但运行指令依赖未包含的本地脚本和绝对路径,存在可疑之处,需检查后使用。
评估建议
暂勿直接安装或运行。SKILL.md要求运行未包含在包中的本地Python脚本,指向不包含在包中的绝对路径。使用前:(1) 请求发布者提供实际脚本和引用文件;(2) 检查脚本仅提取目标URL,不读取无关文件或泄露数据;(3) 优先使用经过验证的安装指令;(4) 在沙盒环境中首次运行。如果作者无法提供脚本或解释绝对路径,视为不可信任。...详细分析 ▾
⚠ 用途与能力
名称/描述描述了一个网页到Markdown的提取器是一致的。然而,该技能声明没有代码、没有安装和没有环境要求,但SKILL.md指示运行一个不包含在包中的本地Python脚本(scripts/scrapling_fetch.py)。这种不匹配(声明没有内容 vs. 指令要求本地文件)是不一致的。
⚠ 指令范围
指令告诉代理执行位于绝对/用户特定路径(/Users/zzd/.openclaw/...)的Python脚本,并引用本地“references”文件。这些路径在声明的范围之外,如果存在,会导致代理访问任意本地文件。SKILL.md还允许安装Python包,但主要的运行时行为依赖于运行一个未捆绑或未验证的外部脚本。
ℹ 安装机制
没有提供安装规格(仅指令),这降低了安装器风险。SKILL.md建议如果缺失,则安装pip包(scrapling和html2text)——对于基于Python的fetcher来说这是正常的,但pip包“scrapling”是未经验证的引用,可能是任何第三方包。
⚠ 凭证需求
该技能声明没有所需的环境变量或配置路径,但指令引用了特定用户主目录下的绝对本地文件系统路径。这是不一致的:指令隐式要求访问那些本地文件。没有请求凭证,但隐式的文件系统访问与包元数据不成比例。
✓ 持久化与权限
该技能未标记为“always: true”且不请求持久权限。它可以由用户调用并默认自主运行,这是正常的。没有证据表明它修改其他技能或系统范围的设置。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/3/9
初始发布
● 无害
安装命令 点击复制
官方npx clawhub@latest install clean-web-fetch
镜像加速npx clawhub@latest install clean-web-fetch --registry https://cn.clawhub-mirror.com
技能文档
请参见下方翻译(保留原始YAML前置matter不翻译)
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制