douyin-to-obsidian

Name: douyin-to-obsidian
Rating: 1

抖音视频文案自动提取工具，一键将抖音视频转为结构化 Obsidian 笔记。支持绕过风控、本地 Whisper 语音识别、长视频分段处理。

1· 204·0 当前·0 累计

by @scutlhp·MIT-0

短视频内容平台

使用场景：下载抖音视频分析抖音数据抖音内容创作TikTok数据获取

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install douyin-to-obsidian

镜像加速npx clawhub@latest install douyin-to-obsidian --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

douyin-to-obsidian 安装说明：安装命令：npx clawhub@latest install douyin-to-obsidian 该技能用于抖音相关操作，可能需要相应的平台账号或API密钥

需要定制？告诉我你的需求 →

技能文档

Douyin to Obsidian

🎯 抖音视频文案自动提取工具

一键将抖音视频转为结构化 Obsidian 笔记，支持绕过风控、本地 Whisper 语音识别、长视频分段处理。

核心功能 ✅ 智能识别 - 支持抖音短链/分享口令自动解析 ✅ 绕过风控 - 自动绕过抖音滑动验证码和 SSR 数据封锁 ✅ 本地识别 - 使用 Whisper AI 本地语音识别，零 API 成本 ✅ 结构化输出 - 自动生成带 YAML Frontmatter 的 Markdown 笔记 ✅ 长视频支持 - 自动分段处理，支持任意时长视频 ✅ 自动安装 - FFmpeg 自动下载，无需手动配置使用方式快速开始 # 1. 安装依赖 pip 安装 -r scripts/requirements.txt

# 2. 安装浏览器自动化 playwright 安装 chromium

# 3. 运行提取 python scripts/运行_提取.py "https://v.douyin.com/xxxxx/"

输入格式

支持多种输入格式：

完整 URL: https://v.douyin.com/xxxxx/ 分享口令：3.58 KJi:/ d@A.tR 06/21 通达信自选股+Python#qmt#量化交易 https://v.douyin.com/xxxxx/ 短链接：https://v.douyin.com/xxxxx/ 输出示例

笔记自动保存到 Obsidian 目录（默认：E:\icloud\iCloudDrive\iCloud~md~obsidian\myobsidian）

标题：视频标题作者：作者名链接：https://v.douyin.com/xxx 时长：7 分 42 秒提取时间：2026-03-22 20:15:00 标签：#AI #杨立昆 #AGI

# 视频标题

完整的语音识别文案内容...

技术特点反爬策略精选模态链接绕过风控自定义 User-代理和浏览器指纹智能短链解析和重定向处理语音识别 OpenAI Whisper base 模型（中文优化）支持长视频自动分段（默认 10 分钟/段）自动标点符号和文本规范化架构设计基于 a同步io 的异步处理 FFmpeg 自动下载和管理临时文件自动清理系统要求 Python: 3.8+ 磁盘空间: 首次运行约 200MB（Whisper 模型 + FFmpeg）操作系统: Windows（macOS/Linux 需手动安装 FFmpeg）依赖项请求s>=2.31.0 AIohttp>=3.9.0 ffmpeg-python>=0.2.0 openAI-whisper>=20231117 openAI>=1.0.0 playwright>=1.40.0

常见问题 Q: 运行时提示找不到 ffmpeg？

A: 首次运行时会自动下载 FFmpeg（约 100MB），请确保网络连接正常。Windows 用户无需手动安装。

Q: 语音识别很慢？

A: 首次运行需下载 Whisper 模型（base 模型约 150MB），后续会使用缓存。识别速度取决于 CPU 性能。

Q: 如何修改保存路径？

A: 编辑 scripts/运行_提取.py 第 50 行的 base_dir 变量。

Q: 提取失败怎么办？

A: 检查网络连接，确保能访问抖音。如仍失败，查看生成的 fAIled_page.html 和 fAIled_ssr_data.json 文件。

文件结构 douyin-to-obsidian/ ├── 技能.md # 技能描述 ├── README.md # 详细说明 ├── scripts/ │ ├── 运行_提取.py # 主入口 │ ├── 提取器.py # 核心引擎 │ └── requirements.txt # 依赖列表 └── reference/ └── architecture.md # 架构文档

更新日志 v1.0.0 (2026-03-22) 🎉 初始发布 ✅ 抖音短视频文案提取 ✅ 本地 Whisper 语音识别 ✅ FFmpeg 自动下载 ✅ 结构化 Obsidian 输出 License

MIT-0

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐