URL to Markdown — URL 到 Markdown

v1.0.0

从HTTP/HTTPS URL将HTML网页转换为干净、可读的Markdown文件，支持可选的批量处理和格式化功能。

0· 0·0 当前·0 累计

by @rwonly (Rex Wang)

文档工具数据与API 数据库网络工具浏览器自动化

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install url2md

镜像加速npx clawhub@latest install url2md --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

Url2md 将网页转换为干净、可读的 Markdown。快速开始单个 URL python3 scripts/url2md.py https://example.com/article 输出到文件： python3 scripts/url2md.py https://example.com/article -o article.md 批量转换创建一个包含 URL 的文件（每行一个）： https://example.com/article-1 https://example.com/article-2 https://example.com/article-3 转换所有并保存到目录： python3 scripts/url2md.py -f urls.txt -d ./markdown_files/ 功能无依赖：仅使用 Python 标准库（urllib, html.parser）标题提取：自动添加页面标题作为 H1 链接解析：将相对 URL 转换为绝对基本格式：标题、段落、列表、链接、图像、代码块、表格噪音去除：去除脚本、样式、导航、页脚和其他模板脚本参考 scripts/url2md.py 用法：url2md.py [url] [选项] 选项：选项描述 url 要转换的单个 URL -o, --output 输出文件（默认：stdout） -f, --file 包含要转换的 URL 的文件 -d, --dir 批量转换的输出目录 --no-title 跳过添加页面标题作为 H1 --timeout 请求超时时间（秒）（默认：30） -v, --version 显示版本示例： # 单个 URL 到 stdout python3 scripts/url2md.py https://docs.python.org/3 # 保存到文件 python3 scripts/url2md.py https://docs.python.org/3 -o python-docs.md # 批量转换，自定义超时时间 python3 scripts/url2md.py -f urls.txt -d ./output/ --timeout 60 # 跳过标题 python3 scripts/url2md.py https://example.com --no-title 何时使用将文档页面转换为 Markdown 以进行本地参考将网页文章存档为文本文件从动态源构建静态内容在浏览器工具不可用时提取可读内容批量处理 URL 列表限制仅转换静态 HTML，不执行 JavaScript 复杂布局（多列、重度 CSS）可能会失去结构完整性需要登录或付费的内容需要身份验证令牌限速网站可能会阻止重复请求

数据来源：ClawHub ↗ · 中文优化：龙虾技能库