运行时依赖
安装命令
点击复制本土化适配说明
douyin-to-obsidian 安装说明: 安装命令:npx clawhub@latest install douyin-to-obsidian 该技能用于抖音相关操作,可能需要相应的平台账号或API密钥
技能文档
Douyin to Obsidian
🎯 抖音视频文案自动提取工具
一键将抖音视频转为结构化 Obsidian 笔记,支持绕过风控、本地 Whisper 语音识别、长视频分段处理。
核心功能 ✅ 智能识别 - 支持抖音短链/分享口令自动解析 ✅ 绕过风控 - 自动绕过抖音滑动验证码和 SSR 数据封锁 ✅ 本地识别 - 使用 Whisper AI 本地语音识别,零 API 成本 ✅ 结构化输出 - 自动生成带 YAML Frontmatter 的 Markdown 笔记 ✅ 长视频支持 - 自动分段处理,支持任意时长视频 ✅ 自动安装 - FFmpeg 自动下载,无需手动配置 使用方式 快速开始 # 1. 安装依赖 pip 安装 -r scripts/requirements.txt
# 2. 安装浏览器自动化 playwright 安装 chromium
# 3. 运行提取 python scripts/运行_提取.py "https://v.douyin.com/xxxxx/"
输入格式
支持多种输入格式:
完整 URL: https://v.douyin.com/xxxxx/ 分享口令:3.58 KJi:/ d@A.tR 06/21 通达信自选股+Python#qmt#量化交易 https://v.douyin.com/xxxxx/ 短链接:https://v.douyin.com/xxxxx/ 输出示例
笔记自动保存到 Obsidian 目录(默认:E:\icloud\iCloudDrive\iCloud~md~obsidian\myobsidian)
标题:视频标题 作者:作者名 链接:https://v.douyin.com/xxx 时长:7 分 42 秒 提取时间:2026-03-22 20:15:00 标签:#AI #杨立昆 #AGI
# 视频标题
完整的语音识别文案内容...
技术特点 反爬策略 精选模态链接绕过风控 自定义 User-代理 和浏览器指纹 智能短链解析和重定向处理 语音识别 OpenAI Whisper base 模型(中文优化) 支持长视频自动分段(默认 10 分钟/段) 自动标点符号和文本规范化 架构设计 基于 a同步io 的异步处理 FFmpeg 自动下载和管理 临时文件自动清理 系统要求 Python: 3.8+ 磁盘空间: 首次运行约 200MB(Whisper 模型 + FFmpeg) 操作系统: Windows(macOS/Linux 需手动安装 FFmpeg) 依赖项 请求s>=2.31.0 AIohttp>=3.9.0 ffmpeg-python>=0.2.0 openAI-whisper>=20231117 openAI>=1.0.0 playwright>=1.40.0
常见问题 Q: 运行时提示找不到 ffmpeg?
A: 首次运行时会自动下载 FFmpeg(约 100MB),请确保网络连接正常。Windows 用户无需手动安装。
Q: 语音识别很慢?
A: 首次运行需下载 Whisper 模型(base 模型约 150MB),后续会使用缓存。识别速度取决于 CPU 性能。
Q: 如何修改保存路径?
A: 编辑 scripts/运行_提取.py 第 50 行的 base_dir 变量。
Q: 提取失败怎么办?
A: 检查网络连接,确保能访问抖音。如仍失败,查看生成的 fAIled_page.html 和 fAIled_ssr_data.json 文件。
文件结构 douyin-to-obsidian/ ├── 技能.md # 技能描述 ├── README.md # 详细说明 ├── scripts/ │ ├── 运行_提取.py # 主入口 │ ├── 提取器.py # 核心引擎 │ └── requirements.txt # 依赖列表 └── reference/ └── architecture.md # 架构文档
更新日志 v1.0.0 (2026-03-22) 🎉 初始发布 ✅ 抖音短视频文案提取 ✅ 本地 Whisper 语音识别 ✅ FFmpeg 自动下载 ✅ 结构化 Obsidian 输出 License
MIT-0