详细分析 ▾
运行时依赖
版本
- 首次发布 segment-anything 技能 (sam-segmentation-zh)。 - 使用 Meta 的 Segment Anything Model (SAM) 提供图像背景去除功能,输出透明 PNG。 - 支持自定义模型、前景点提示及高级选项以提取多个元素。 - 包含 CLI 用法说明与详细参数解释。 - 自动处理模型下载与依赖安装。
安装命令
点击复制本土化适配说明
Segment Anything — 一键智能抠图 安装说明: 安装命令:npx clawhub@latest install segment-anything
技能文档
使用 Meta 的 Segment Anything Model 从图像中提取前景主体,输出透明背景的 PNG 文件。
快速开始
``bash
python3 scripts/segment.py <输入图像> <输出.png>
`
默认以图像中心作为前景提示点——适用于主体居中的人像和产品图。 参数说明
| 参数 | 说明 | 默认值 |
|---|---|---|
| input | 输入图像路径 | 必填 |
| output | 输出 PNG 路径(单目标模式)或目录(--all 模式) | 必填 |
| --model | 模型大小:vit_b(快速)· vit_l(中等)· vit_h(最佳质量) | vit_h |
| --checkpoint | 本地权重文件路径;省略时自动下载 | 自动 |
| --points | 前景提示点,格式为 x,y,可指定多个 | 中心点 |
| --all | 网格扫描模式:提取所有独立元素 | 关闭 |
| --grid | --all 模式的网格密度;16 表示 16×16=256 个探测点 | 16 |
| --iou-thresh | 接受掩码的最低预测 IoU(--all 模式) | 0.88 |
| --min-area | 掩码最小面积占图像比例(--all 模式) | 0.001 | 使用示例
`bash
# 基础背景去除(自动下载 vit_h 约 2.5GB)
python3 scripts/segment.py photo.jpg output.png # 主体偏离中心时指定提示点
python3 scripts/segment.py photo.jpg output.png --points 320,240
# 多提示点 + 轻量模型
python3 scripts/segment.py photo.jpg output.png --model vit_b --points 320,240 400,300
# 提取所有元素(每个元素输出一个 PNG)
python3 scripts/segment.py photo.jpg ./elements/ --all
# 使用更密集的网格捕获小物体
python3 scripts/segment.py photo.jpg ./elements/ --all --grid 32
# 使用本地权重文件
python3 scripts/segment.py photo.jpg output.png --checkpoint /path/to/sam_vit_h_4b8939.pth
`
依赖安装
segment_anything 首次运行时自动安装,也可手动安装:
`bash
pip install git+https://github.com/facebookresearch/segment-anything.git
pip install pillow numpy torch torchvision
` 工作流程
- 用户提供图像路径
- 询问是否需要提示点(主体偏离中心时)
运行脚本;权重文件首次使用时自动下载至~/.cache/sam/- 输出透明背景的 PNG 文件
模型选择
| 模型 | 大小 | 速度 | 质量 |
|---|---|---|---|
| vit_b | ~375 MB | 最快 | 良好 |
| vit_l | ~1.25 GB | 中等 | 较好 |
| vit_h` | ~2.5 GB | 较慢 | 最佳 | 有 GPU 时自动使用 CUDA 加速。