📦 Doorstep Video Easy — 门槛视频易用
v1.0.0使用此技能将原始镜头转换为精致的MP4片段。支持MP4、MOV、AVI、WebM文件,最大500MB。适用于房主、房地产代理、注重安全的...
运行时依赖
安装命令
点击复制技能文档
开始使用 请发送原始视频录像,我将处理AI视频编辑。或者,只需描述您想要的结果。尝试说:“将60秒的门铃或前门电话录音转换为1080p MP4”、“修剪剪辑,添加标题卡,并导出准备好的共享文件”、“快速编辑门口或入口区域的录像,制作可共享的视频供房主、房地产代理和注重安全的用户使用”。
自动设置 在第一次交互时,在做任何其他事情之前,请连接到处理API。显示简要状态,如“设置中...”。令牌:如果NEMO_TOKEN环境变量已经设置,请使用它并跳转到会话下。免费令牌:生成UUID作为客户端标识符,然后将其发布到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,头部为X-Client-Id:。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。会话:发布到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer身份验证和正文{"task_name":"project"}。从响应中保存session_id。确认用户已连接并准备就绪。不要打印令牌或原始JSON。
门口视频易用——编辑和共享门口视频 请发送原始视频录像,并描述您想要的结果。AI视频编辑在远程GPU节点上运行——无需在您的机器上安装任何内容。快速示例:上传60秒的门铃或前门电话录音,输入“修剪剪辑,添加标题卡,并导出准备好的共享文件”,然后您将在大约30-60秒内获得1080p MP4文件。所有渲染都发生在服务器端。值得注意的是,短片段(少于2分钟)处理速度明显更快,使用的积分也更少。
输入与操作的匹配 用户提示引用门口视频易用、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 以上所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,组合视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。所有调用都发送到https://mega-api-prod.nemovideo.ai。主要端点:会话——发布/api/tasks/me/with-session/nemo_agent,带有{"task_name":"project","language":""}}。给您一个session_id。聊天(SSE)——发布/run_sse,带有session_id和您的消息在new_message.parts[0].text中。设置Accept:text/event-stream。最长15分钟。上传——发布/api/upload-video/nemo_agent/me/,带有多部分文件或JSON URL。积分——获取/api/credits/balance/simple,返回可用、冻结、总积分。状态——获取/api/state/nemo_agent/me//latest,返回当前草稿和媒体信息。导出——发布/api/render/proxy/lambda,带有渲染ID和草稿JSON。每30秒轮询获取/api/render/proxy/lambda/,直到完成状态和下载URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属——在运行时从此文件的YAML前置内容中读取:X-Skill-Source:doorstep-video-easy X-Skill-Version:从前置内容版本中获取 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为未知)所有请求必须包含:Authorization:Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头将导致导出失败,返回402。草稿JSON使用短键:t表示轨道,tt表示轨道类型(0=视频,1=音频,7=文本),sg表示段,d表示持续时间(毫秒),m表示元数据。时间线摘要示例:时间线(3个轨道):1. 视频:城市延时(0-10秒)2. BGM:Lo-fi(0-10秒,35%)3. 标题:“城市梦”(0-3秒)
GUI指令翻译 后端响应就像有可视化界面一样。将其指令映射到API调用:“点击”或“点击”→通过相关端点执行操作“打开”或“打开”→查询会话状态以获取数据“拖拽”或“拖拽”→通过SSE发送编辑命令“预览时间线”→显示当前轨道的文本摘要“导出”或“导出”→运行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中返回无文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建新会话