📄 LLMWhisperer — 图像与PDF文本提取

v0.0.7

利用LLMWhisperer API从图像和PDF中提取文本和布局,适合手写体和复杂表单的处理。

1· 2.9k·6 当前·6 累计
by @gumadeiras (Gustavo Madeira Santana)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/2/27
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
该技能的运行指令基本符合其声明目的(上传文件到OCR API),但包元数据未列出配置/环境要求,并引用了一个不存在的脚本路径,这些不一致性在安装或使用敏感文档前应谨慎处理。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.0.72026/1/21

["直接将完整的llmwhisperer shell脚本添加到SKILL.md以便参考。","将脚本位置澄清为scripts/llmwhisperer,而不是用户主目录子目录路径。","无安装或使用说明的更改;示例使用保持不变。"]

无害

安装命令

点击复制
官方npx clawhub@latest install llmwhisperer
🇨🇳 镜像加速npx clawhub@latest install llmwhisperer --registry https://cn.longxiaskill.com

技能文档

从图像和PDF中提取文本,使用LLMWhisperer API — 适合手写体和复杂表单。

配置

要求在~/.clawdbot/.env中设置LLMWHISPERER_API_KEY
echo "LLMWHISPERER_API_KEY=your_key_here" >> ~/.clawdbot/.env

获取API密钥

unstract.com/llmwhisperer获取免费API密钥。
  • 免费层: 每日100页

使用

llmwhisperer <文件>

脚本源

可执行脚本位于scripts/llmwhisperer
#!/bin/bash
# 使用LLMWhisperer API提取文本
if [ -z "$LLMWHISPERER_API_KEY" ]; then
  if [ -f ~/.clawdbot/.env ]; then
    # shellcheck disable=SC2046
    export $(grep -v '^#' ~/.clawdbot/.env | grep 'LLMWHISPERER_API_KEY' | xargs)
  fi
fi
if [ -z "$LLMWHISPERER_API_KEY" ]; then
  echo "Error: 未在env或~/.clawdbot/.env中找到LLMWHISPERER_API_KEY"
  exit 1
fi
FILE="$1"
if [ -z "$FILE" ]; then
  echo "Usage: $0 <文件>"
  exit 1
fi
curl -s -X POST "https://llmwhisperer-api.us-central.unstract.com/api/v2/whisper?mode=high_quality&output_mode=layout_preserving" \
  -H "Content-Type: application/octet-stream" \
  -H "unstract-key: $LLMWHISPERER_API_KEY" \
  --data-binary "@$FILE"

示例

在终端打印文本:
llmwhisperer flyer.jpg
保存输出到文本文件:
llmwhisperer invoice.pdf > invoice.txt
处理手写笔记:
llmwhisperer notes.jpg

数据来源:ClawHub ↗ · 中文优化:龙虾技能库