📦 Podcast Show Notes Generator — 播客节目笔记生成器

v1.0.0

将播客转录或音频文件转换为完整的发布包 —— SEO 优化的节目笔记、章节时间戳、引用语、社交媒体剪辑建议...

0· 0·0 当前·0 累计

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install podcast-show-notes-generator
镜像加速npx clawhub@latest install podcast-show-notes-generator --registry https://cn.longxiaskill.com✓ 镜像可用
需要定制?告诉我你的需求 →

技能文档

播客节目笔记生成器 将原始播客转录或音频文件转换为完整的发布包。该代理作为播客制作人 + 内容营销师,将对话转换为SEO节目笔记、章节标记、引用语、社交媒体剪辑建议、新闻简报摘要、YouTube和Spotify描述、嘉宾推广副本和测试标题变体——主持人需要的一切来发布一集。

使用方法 当您有一个已录制的节目(音频或转录)并需要一次性生成所有周围的书面资产时,请调用此技能。 基本调用:从此转录生成节目笔记:[粘贴转录] 这是与Sarah Chen的第47集的MP3文件——给我完整的发布包 从此集写出SEO节目笔记、时间戳和5个社交媒体剪辑 背景:播客:“Builder's Edge”——独奏创始人,每周45-60分钟的节目。语气是对话式的,受众是技术人员 嘉宾是Marcus Lee,Vendr的CTO。本集涵盖了采购自动化 我们在Spotify、Apple、YouTube和Substack新闻简报上发布——为所有四个平台生成资产

代理摄取音频或转录,提取元数据,根据每个分发渠道结构输出,并返回一个可复制的包。

工作原理 步骤1:输入摄取 代理接受两种输入模式: 音频文件 → 转录:输入:episode-47.mp3(原始音频) 流程:

  • 运行Whisper(默认为large-v3)进行转录
whisper episode-47.mp3 --model large-v3 --output_format json --word_timestamps True
  • 使用pyannote.audio进行说话人识别以分离主持人/嘉宾回合
  • 保留单词级时间戳以实现准确的章节标记和剪辑
  • 恢复标点符号和大写字母以提高可读性
  • 轻度编辑通过——删除填充词(“um”,“uh”,“like”当过度使用时),保留语音
输出:带有[00:14:32]时间戳和SPEAKER标签的清理转录

预先存在的转录:输入:transcript.txt或.vtt或Descript导出 流程:

  • 检测格式并将其规范化为内部结构(speaker、start_ts、end_ts、text)
  • 如果时间戳缺失,代理从单词数和平均WPM估算它们
  • 如果说话者未标记,代理从上下文中推断(“那么,Marcus,告诉我关于...”)
代理将询问要使用的模式并请求文件路径或粘贴文本。它可以处理长达~3小时的音频转录。

步骤2:集元数据提取 代理阅读完整转录并提取: 字段 如何提取 嘉宾姓名 主持人或嘉宾的第一次介绍 嘉宾标题/公司 短语,如“我是Marcus,Vendr的CTO”或主持人介绍 嘉宾简介(3-4句) 从介绍段和对话中提到的任何简介详细信息中拼接 集标题候选项 根据主题频率和情感权重的前3-5个主题 关键主题 在转录块上进行NER + 主题聚类(通常为4-8个主题) 值得注意的提及 书籍、工具、公司、人员的引用——用于资源部分 集时长 时间戳 引用密度 存在多少可引用行的评分(告知剪辑数量) 示例元数据输出: guest: name: “Marcus Lee” title: “联合创始人和CTO” company: “Vendr” bio: | Marcus Lee是Vendr的联合创始人和CTO,Vendr是一家SaaS采购平台,已为公司节省了超过4亿美元的软件合同费用。在Vendr之前,他曾在HubSpot领导采购工程。他在marcuslee.com上撰写关于谈判杠杆和采购自动化的文章。 links: twitter: “@marcuslee” linkedin: “linkedin.com/in/marcuslee” company: “vendr.com” episode: duration: “52:14” topics:

  • “采购团队如何在续约中失去杠杆”
  • “为什么企业SaaS中的清单价格是一个虚构”
  • “从价格数据构建谈判手册”
  • “AI辅助采购的未来”
mentions: books: [“永远不要分割差异”,“关于艰难事物的艰难事物”] tools: [“Vendr”,“Coupa”,“Ironclad”] companies: [“HubSpot”,“Stripe”,“Brex”]

步骤3:时间戳生成(章节标记) 代理根据主题转变(而不是时间间隔)每5-10分钟生成章节标记。它使用语义块来查找自然的节边界。 章节生成逻辑: 滑动窗口在转录上(3分钟窗口,1分钟重叠) 嵌入每个窗口,计算与邻居的余弦距离 识别距离峰值(主题转变) 快照到最近的自然暂停(音频中的较长沉默或转录中的段落断点) 生成总结段的5-9个字的章节标题 拒绝少于3分钟的章节(与邻居合并) 00:00 — 简介和Marcus从HubSpot到Vendr的路径 03:42 — 为什么清单价格是一个完全虚构的东西 09:18 — 续约陷阱:供应商如何捕获您 16:05 — 从价格数据构建谈判手册 24:30 — 何时放弃供应商 31:12 — 采购中的AI代理:炒作与现实 40:55 — Marcus的最大谈判

数据来源ClawHub ↗ · 中文优化:龙虾技能库