首页龙虾技能列表 › volc-vision — 火山引擎 ARK 图像理解

🖼️ volc-vision — 火山引擎 ARK 图像理解

v0.1.0

使用火山引擎 ARK API 进行图片理解、描述、视觉问答和图像分析,适用于各种图片相关查询和分析场景。

0· 216·1 当前·1 累计
by @big-dust·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/25
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的代码、运行指令和所请求的 API 密钥与图像理解工具一致,后者将图片发送到 Volc Engine ARK API,没有请求无关的凭证或安装任意第三方代码。
评估建议
该技能与其声明的目的相符,但请注意,它会将您传递的任何图片(包括本地文件)发送到外部 ARK 服务,使用 ARK_API_KEY。仅提供非敏感图片,并仅使用您信任的 API 密钥与该外部服务。安装前,请验证 API 主机名和您的操作员关于发送图片到第三方 API 的政策。如果需要限制上传,请避免传递任意文件系统路径或敏感内容的 base64。...
详细分析 ▾
用途与能力
名称/描述、所需二进制(node)和所需环境变量(ARK_API_KEY)与调用外部视觉 API 的工具一致。代码使用 ARK API 密钥来对 ARK 端点的请求进行身份验证,这是该目的的预期行为。
指令范围
SKILL.md 和 index.js 指示从本地路径、URL 或数据 URL 读取图像,并将其(作为 base64 数据 URL)发送到外部 ARK API。这对于声明的目的是必要的,但这意味着任何传递给技能的本地文件路径将被读取和外部传输——如果提供敏感文件,则存在隐私/数据外泄风险。
安装机制
没有安装规格;这是指令 + 一个 Node 脚本。唯一的运行时要求是 PATH 上的 node。安装步骤没有下载或写入磁盘。
凭证需求
仅要求 ARK_API_KEY(主凭证),这与调用已验证的外部 API 成比例。代码如预期在 Authorization 标头中使用该密钥。没有请求无关的秘密或配置路径。
持久化与权限
技能不是始终启用,不请求提升的平台权限或修改其他技能。它本身不持久存储凭证。允许自主调用(平台默认),但不与其他令人担忧的权限结合。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.1.02026/3/25

首次发布:补充标准 frontmatter、中文触发描述、依赖说明与环境变量要求。

● 无害

安装命令 点击复制

官方npx clawhub@latest install volc-vision
镜像加速npx clawhub@latest install volc-vision --registry https://cn.clawhub-mirror.com

技能文档

适用场景

  • 用户发送图片并询问关于图片的问题
  • 需要理解、分析、描述图片时
  • 用户说“看看这张图”“描述一下”“这图是什么”“图里有什么”“帮我分析图片内容”
  • 需要对本地图片路径、图片 URL 或 base64 图片做视觉问答

输入参数

参数必填说明
image图片路径、URL 或 base64
prompt要问的问题,默认 描述这张图片
## 使用方式
# 命令行调用
node skills/volc-vision/index.js <图片路径> "<问题>"
# 示例
node skills/volc-vision/index.js /path/to/image.jpg "描述这张图片"
node skills/volc-vision/index.js https://example.com/image.jpg "这图里有什么"

模型优先级(按强弱排序)

Vision 系列优先,其他模型按能力依次降序:
  • doubao-seed-1-6-vision-250815 🌟 首选
  • doubao-1-5-vision-pro-32k-250115 🌟
  • doubao-seed-2-0-pro-260215
  • doubao-seed-1-8-251228
  • doubao-seed-2-0-lite-260215
  • doubao-seed-2-0-mini-260215
自动切换:如果不指定模型,会按列表顺序依次尝试可用模型,直到成功。

环境变量

# 必需:ARK API Key
export ARK_API_KEY="your_api_key"
# 可选:指定模型
export VISION_MODEL="doubao-seed-1-6-vision-250815"

指定模型

ARK_API_KEY=your_api_key VISION_MODEL=doubao-seed-1-6-vision-250815 node skills/volc-vision/index.js <图片> "<问题>"

返回

  • 图片描述
  • 视觉问答结果
  • 图像分析文本结果

调用示例

用户:看看这张图 -> agent 调用: node skills/volc-vision/index.js /root/.openclaw/media/inbound/xxx.jpg "描述这张图片" -> 返回描述结果

注意事项

  • 使用前必须设置 ARK_API_KEY
  • 如果用户只是要生成图片而不是理解图片,不要误用本技能
  • 若已有明确视觉问题,优先把问题放进 prompt,不要只做泛泛描述
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务