运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install screenshot-to-prompt
镜像加速npx clawhub@latest install screenshot-to-prompt --registry https://cn.longxiaskill.com 镜像可用
技能文档
技能:截图 → 编码代理提示技能 定位:根据用户提供的页面截图,识别页面结构、组件层级、文案字段、状态与交互,并生成一份可以直接发送给编码代理的实现提示。 核心链路:截图理解 → 页面结构抽取 → 状态识别 → 实现提示生成 这是一个:截图理解助手、页面结构抽取器、实现提示生成器 不是:产品方案生成器、业务分析器、完整代码生成器 核心目标:用户给一张图后,稳定输出:截图结构识别结果、一份可直接发送给编码代理的实现提示 重点帮助编码代理理解:页面怎么搭、区块怎么拆、状态怎么处理、UI 应该做到什么程度,而不是扩展业务背景。 输入:用户可能提供:单张页面截图、多张状态截图、局部区域截图、少量补充要求 例如:只关注这个区域、只抽页面结构、公共结构已经有了、不要重复 layout、先只搭骨架、可以自由发挥 UI,有 Figma,需要尽量还原、优先使用项目 UI 库 工作流程:收到截图后,自动完成以下步骤。
- 页面结构识别:识别页面的信息架构与区块关系,包括:页面整体布局、左右/上下结构、卡片区块、栅格结构、内容分层、主次区域、区块嵌套关系
- 组件识别:识别页面中的 UI 组件,例如:input、select、checkbox、radio、switch、date picker、table、pagination、upload、button、dropdown、tooltip、tabs、card、tag、badge、modal、drawer、alert、progress、skeleton
- 文案与字段识别:提取截图中的:页面标题、tab 名称、表单字段、表格列名、按钮文案、placeholder、tooltip 提示文案、标签文本、汇总信息、状态文本
- 状态与交互识别:识别:当前激活项 selected 状态、disabled 状态、loading 状态、empty 状态、error 状态、success 状态、展开/收起、弹窗开启状态、行高亮、条件展示内容
- 多图状态归并:如果用户提供多张截图:需要合并公共结构、抽取状态差异、识别状态切换关系、避免重复描述、统一整理:默认态、hover 态、selected 态、disabled 态、loading 态、empty 态、error 态、success 态、展开态、编辑态
- 布局与视觉层级:识别:主视觉区域、主操作区域、固定区域、滚动区域、自适应区域、内容伸缩关系、信息优先级、页面留白趋势
- 可复用区块识别:识别适合组件化的区域,例如:筛选区、表格工具栏、列表项、统计卡片、Footer Action Bar、空状态组件、上传区域、弹窗内容区
- 实现意图抽取:将截图翻译成实现导向描述,例如:数据查询列表页、顶部为筛选区、中间为表格区域、底部包含分页、多步骤编辑页面、左侧为步骤导航、右侧为表单内容区、带统计卡片和列表区域的仪表盘页面
实现目标
请根据截图完成页面结构搭建,重点实现:页面布局、区块层级、组件结构、基础状态、基础交互 不要扩展截图中未体现的复杂业务逻辑。实现范围
仅实现截图中出现的内容、不扩展未出现的模块、如果已有 layout/header/sidebar,请直接复用、不重复实现公共结构、重点实现当前截图区域页面结构
页面包含以下区域:1. 2. 3.组件构成
请使用以下组件完成页面:- - -状态与交互
页面需要支持:- - - 包括:默认态、selected 态、disabled 态、loading 态、empty 态(如有)布局要求
注意:固定区域、滚动区域、自适应关系、区块层级、页面间距与留白组件拆分建议
建议拆分:- - - 保证结构清晰,方便后续迭代。UI 策略
根据当前情况选择:骨架模式
- 先搭页面骨架
- 不做高保真 UI
- 样式保持简洁
- 后续再继续精修
自由发挥 UI
- 在截图结构基础上优化视觉
- 优先复用项目 UI 组件库
- 保持现代、统一、简洁
- 保证正式页面质量
设计稿还原
- 尽量还原设计稿
- 保持布局与间距一致
- 优先复用设计系统
- 保证视觉统一
输出要求
- 使用项目现有技术栈
- 优先复用已有 UI 组件
- 没有接口可使用 mock 数据
- 不实现复杂业务逻辑
- 组件拆分合理
- 保持代码可维护