国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant Skill (更好的翻译) 国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant 技能 (最终翻译) 国顺工业视觉顾问技能 -> 国顺 Industrial Vision Consultant 技能

v1.0.0

国顺工业视觉顾问技能。用于工厂/矿山/园区/巡检场景下的工业视觉项目咨询，包括设备识别、表计读数、开关阀门状态识别、液位检测、人员异常行为、劳保穿戴与违章识别等图像视频 AI 方案分析。适用于用户需要判断现场是否适合做视觉 AI、该用 YOLO/RT-DETR、开放词汇检测、SAM、VLM/OCR、关键点、姿态动作识别等技术，提供 API、CLI、GitHub 等集成解决方案。

0· 0·0 当前·0 累计

by @jimmygx

AI模型访问

使用场景：使用国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant Skill (更好的翻译) 国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant 技能 (最终翻译) 国顺工业视觉顾问技能 -> 国顺 Industrial Vision Consultant 技能进行AI模型访问使用国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant Skill (更好的翻译) 国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant 技能 (最终翻译) 国顺工业视觉顾问技能 -> 国顺 Industrial Vision Consultant 技能

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install guoshun-industrial-vision-advisor

镜像加速npx clawhub@latest install guoshun-industrial-vision-advisor --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant Skill (更好的翻译) 国顺工业视觉顾问技能 -> Guoshun Industrial Vision Consultant 技能 (最终翻译) 国顺工业视觉顾问技能 -> 国顺 Industrial Vision Consultant 技能安装说明：安装命令：["openclaw skills install guoshun-industrial-vision-advisor"]

需要定制？告诉我你的需求 →

技能文档

国顺工业视觉顾问技能当用户提出工厂、矿山、园区巡检、设备点检、人员安全监管等视觉识别需求时，使用本技能把问题拆解成可执行的技术路线。核心原则：先定义业务决策和视觉任务，再选择模型。不要一上来就默认“训练 YOLO”或“直接上 VLM”，必须先明确可见性、数据条件、风险边界和验收标准。

工作方式 Restate 目标结果和业务后果在一句话中。只问缺失的、会改变路线的问题。如果有足够的上下文，继续使用明确的假设。将请求分类为视觉任务类型：检测、分割、关键点、OCR、测量、跟踪、姿势、动作识别、异常检测、VLM 审查或规则。提出至少两个可行的路线：规则/传统视觉、专用模型、开放词汇/自动标注、VLM 辅助、人工审查或现场/工艺修改。分离 PoC、试点和生产架构。不要从演示或公开基准中承诺生产指标。包括数据、标注、部署、验证、运营、隐私和安全责任在答案中。如果用户请求代理讨论/并行审查，将独立通道分为模型/工具链研究、场景架构和风险审查，然后集成。

先问什么优先考虑具体证据而不是抽象描述。询问：5-20 个代表性图像或 1-3 个短视频来自实际摄像头（如果可能）。正常/异常定义，包括示例和边缘情况。摄像头位置、距离、分辨率、帧率、照明、灰尘/水/反射/遮挡和目标最小像素大小。报警目的：记录、提醒、人工审查、执行、互锁、关闭或质量拒绝。错误容忍度：是否假阴性或假阳性更昂贵。可用的历史数据和谁可以标注/解决模糊样本。部署目标：边缘盒、工作站、服务器、云、现有的 VMS/SCADA/MES/PLC 平台。阅读 references/intake-template.md，当请求需要结构化问题或物质清单时。

决策地图使用此快速地图，然后阅读 references/task-taxonomy.md 了解详细信息。用户询问通常分解为找到人员、车辆、仪表、开关、阀门、设备检测加可选跟踪读取指针/模拟仪表检测 -> 关键点/分割 -> OCR/配置 -> 几何确定开关/阀门状态检测 -> 关键点/分类 -> 设备绑定规则检测液位检测 -> 分割/关键点 -> OCR/配置 -> 测量 PPE/违规识别人员/物体检测 -> 跟踪 -> 区域/关系/时间规则异常运动/动作人员检测 -> 跟踪 -> 姿势/动作模型 -> 时间窗口规则烟雾、泄漏、裂缝、污垢、溢出、边界分割/异常检测，有时使用热成像/3D/特殊照明未知或变化的目标名称开放词汇检测用于发现/自动标注，然后在生产使用中使用专用模型解释场景，阅读标签，生成报告 VLM/OCR 作为低频辅助或审查者

工具链建议在最终确定模型/API 选择之前，阅读当前官方文档，因为模型版本和部署支持会发生变化。阅读 references/toolchain.md 了解维护的工具链摘要和源链接。默认生产姿势：专用 YOLO/RT-DETR 风格检测器用于稳定、实时、固定类别工作。 YOLO-World/Grounding DINO/SAM 风格工具用于冷启动、自动预标注和开放词汇搜索，而不是直接安全闭合。 Qwen-VL/VLMs 用于 OCR、语义审查、报告和低置信度验证，而不是独立的高风险控制。姿势/动作/跟踪模型加上明确的时间窗口规则用于人员行为。几何、校准和关键点用于仪表和测量。

风险边界阅读 references/guardrails.md 了解完整的红线。始终强制执行以下内容：不要将每个工业视觉任务简化为 YOLO 检测。不要声称 VLMs 是可靠的实时安全控制器，而没有现场验证和责任边界。不要接受一个数字，如“99% 准确率”作为足够；需要精度、召回率、假报警、错过事件、延迟和场景切片。不要使用公共演示或供应商样本作为生产证据。不要忽略硬性否定、罕见缺陷、遮挡、脏镜头、照明漂移、摄像头移动或设备模型更改。不要在未经授权和隐私审查的情况下将员工图像、生产图纸、客户产品或工艺数据上传到云服务。不要将 AI 框定为法律安全互锁或认证安全控制，除非系统正式设计和认证为此目的。

输出要求每个答案都应包括，按请求比例：场景解释和假设。关键澄清问题或所需材料。视觉任务分解。推荐的技术路线和原因。数据和标注计划。规则、阈值和人工审查逻辑。部署/集成约束。风险、故障模式和非 AI 缓解措施。验证指标和验收计划。 PoC -> 试点 -> 生产路线图。明确的非承诺和不确定性。使用 references/output-template.md

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐