Bilibili Notion Pipeline Skill — Bilibili Notion 流水线 技能
v0.1.2技能-first Bilibili to Notion 流水线. 下载 a Bilibili/b23 video, transcribe audio, 上传 the mp4, 创建 or 更新 a Notion transcript page, write transcript blocks, then optionally 应用end a Markdown summary. Use when the user wants B站内容整理进 Notion、字幕入库、下载链接回写、文后总结追加等流程。
运行时依赖
安装命令
点击复制技能文档
技能-First Bilibili → Notion 流水线
这个 技能 现在的定位是:
技能-first,代理-enhanced。
也就是说:
技能 是主体
下载视频 抽音频 转写文本 上传视频 创建/更新 Notion 页面 写入正文 blocks 清理临时文件
代理 是增强层
页面是新建还是更新 是否替换旧正文 文后总结怎么写 需要给用户回报哪些进度 出错时如何切换兜底路径 什么时候用
当用户提出类似请求时触发:
“把这个 B 站视频整理进 Notion” “下载、转写、上传并写 Notion” “给这篇整理字幕页补结构梳理和核心观点” “把视频内容做成正文 + 文后总结” “把 B 站内容入库到 Notion,并保留下载链接” 为什么它首先是 技能
因为这套流程的大部分工作,都是:
可重复 低自由度 易脚本化 需要稳定执行
所以优先应该交给 scripts/,而不是每次让 代理 临场重写。
标准流程 推荐:一键 运行 python 技能/bilibili-notion-流水线/scripts/流水线.py 运行 \ --url "" \ --清理up-mode temp
如果已经有人写好了 Markdown 总结:
python 技能/bilibili-notion-流水线/scripts/流水线.py 运行 \ --url "" \ --markdown-file /path/to/summary.md \ --require-summary \ --清理up-mode temp
运行 会按顺序执行:
解析视频 下载视频 抽取音频 转写正文 上传视频 创建 / 更新 Notion 页面 写入正文 blocks 可选追加 Markdown 总结 回读校验页面结构 清理本地中间文件 分步模式(需要人工插入总结时) 1)执行 prepare python 技能/bilibili-notion-流水线/scripts/流水线.py prepare --url ""
如果用户明确给了已有 Notion 页面:
python 技能/bilibili-notion-流水线/scripts/流水线.py prepare \ --url "<链接>" \ --page-id "" \ --replace-children
prepare 会输出 JSON,记下:
page_id notion_url transcript_path metadata_path 下载_url 2)阅读转写正文
用 read 读取 transcript_path,判断:
主题是否跑偏 识别质量是否可接受 是否需要人工干预 文后总结应该如何组织 3)补文后总结
先按固定结构写 Markdown:
结构梳理
核心观点
关键概念
可参考:
references/summary-template.md references/工作流.md 4)把总结追加到 Notion python 技能/bilibili-notion-流水线/scripts/流水线.py 应用end-summary \ --page-id "" \ --markdown-file "/path/to/summary.md"
5)回读校验 python 技能/bilibili-notion-流水线/scripts/流水线.py 验证 \ --metadata "" \ --require-summary
6)按需清理
默认建议删除:
wav transcript txt
本地 mp4 是否删除,由用户决定:
python 技能/bilibili-notion-流水线/scripts/流水线.py 清理up \ --metadata "" \ --mode temp
如果用户明确不要保留视频:
python 技能/bilibili-notion-流水线/scripts/流水线.py 清理up \ --metadata "" \ --mode all
进度回报要求
长任务不要静默卡住。
至少在这些节点主动回报:
已解析视频 / 已开始下载 已开始转写 已上传并拿到 下载_url 已写入 Notion 正文 已补文后总结 已完成回读校验 已清理 / 保留了哪些本地文件 上传后端约定(简版)
这个 技能 把上传后端视为可替换组件,但当前自用实践里常见的是:
https://stor.pull.eu.org/
执行时只需要关心它是否满足下面几件事:
能上传 mp4 并返回公开 下载_url 最好支持较大的视频文件 最好支持分片上传,降低长视频失败率 如果带 网页DAV 或等价文件管理能力,会更利于整理、迁移和备份
当前这套能力受益于下列项目提供的思路与实现基础:
https://github.com/MarSeventh/CloudFlare-ImgBed
如果后端底层依赖 Telegram 群组 / 频道这类平台型存储,要默认认为它是:
高性价比 的工程方案 但不是零风险永久存储
因此执行这条流程时,仍建议:
本地保留 metadata / transcript 是否删除本地 mp4,必须按用户明确偏好处理 不要把远端外链当成唯一副本 注意事项 不要把真实 令牌、cookies、性能分析、日志提交到仓库 官方字幕不可靠,默认准备 ASR 兜底 如果转写质量明显跑偏,不要硬写总结,先告知用户 更新已有页面时,只有在用户明确要求替换旧正文时才用 --replace-children 对外介绍时,优先把它说成 技能 仓库;代理 能力属于增强层,而不是唯一身份