首页龙虾技能列表 › Textin Parse

Textin Parse

v1.0.0

Textin 文档解析 API 封装,支持上传图片/pdf/word/html/excel/ppt/txt 等格式进行版面检测、文字识别、表格识别,生成 markdown 文档及结构化数据。 用于:(1) 解析 PDF/图片/文档为 markdown;(2) 提取文档结构化数据;(3) 识别表格和公式;(4) 提...

2· 139·0 当前·0 累计
by @kingjus (KingJus)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/23
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
The skill's code and instructions match its stated purpose (calling Textin's document-parse API); it asks only for service credentials and stores them locally, with no surprising network endpoints or unrelated privileges.
评估建议
This skill appears to do what it says: it sends files or file-URLs to Textin's API and returns parsed markdown/structured data. Before installing: (1) verify you trust the Textin service and the API domain (api.textin.com) because document contents will be uploaded to that third party; (2) be aware credentials are stored in plaintext at ~/.openclaw/textin-config.json — consider storing them in a secure credential manager or removing the file when not needed; (3) avoid providing high-privilege or...
详细分析 ▾
用途与能力
Name/description, included scripts, and runtime instructions consistently implement a Textin document-parsing client that uploads files/URLs to https://api.textin.com/ai/service/v1/pdf_to_markdown. Requested inputs (x-ti-app-id and x-ti-secret-code) are appropriate and expected.
指令范围
SKILL.md and the scripts restrict actions to configuring credentials and sending files/URLs to the Textin API for parsing. Note: using the skill will upload document contents (or URLs) to a third-party service — this is expected behavior but important for privacy/compliance.
安装机制
No install spec; the skill is instruction-plus-scripts only. Provided shell and Python scripts run locally and require standard tools (bash, python3, curl/requests). No downloads from untrusted URLs or package installs are present.
凭证需求
The skill requests only the Textin App ID and Secret, which is proportional to its function. Implementation stores credentials unencrypted in ~/.openclaw/textin-config.json — functional but a plaintext storage/privacy risk the user should be aware of.
持久化与权限
always=false and the skill does not request elevated/system-wide permissions. It does persist credentials to a file in the user's home directory, which is normal for a client but creates a persistent secret on disk that the user may want to manage or encrypt.
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/23

Initial release of textin-parse - 提供文档解析 API 封装,支持图片、PDF、Word、Excel、PPT、HTML、Txt 等格式。 - 支持版面检测、文字识别、表格和公式识别,生成 Markdown 文档及结构化数据。 - 支持多种文件输出格式和解析模式,可选参数丰富。 - 支持表格、目录结构、图像等内容提取。 - 明确注册、配置和使用流程说明。

● 无害

安装命令 点击复制

官方npx clawhub@latest install textin-parse
镜像加速npx clawhub@latest install textin-parse --registry https://cn.clawhub-mirror.com

技能文档

快速开始

第1步:注册获取 API 凭证

首次使用需要先注册 Textin 账号并获取 API 凭证:

  • 访问注册链接:https://www.textin.com/register/code/3EJS7P
  • 注册完成后,登录并进入"开发者与账户信息"页面
  • 获取 x-ti-app-idx-ti-secret-code

获取凭证后,告诉我这两个值,我会帮你配置。

第2步:配置凭证

告诉我你的 x-ti-app-idx-ti-secret-code,我会保存到配置文件中。

第3步:解析文档

配置好凭证后,你可以这样使用:

解析这个PDF文件
解析这张图片为markdown
提取这个文档的目录结构

支持的文件格式

  • 图片:png, jpg, jpeg, bmp, tiff, webp
  • 文档:pdf, doc, docx, html, mhtml, xls, xlsx, csv, ppt, pptx, txt, ofd, rtf
  • 文件大小:最大 500MB

可选参数说明

解析模式 (parse_mode)

  • auto - 由引擎自动选择,适用范围最广
  • scan - 文档统一当成图片解析
  • lite - 轻量版,只输出表格和文字结果
  • parse - 仅电子档文字解析,速度最快
  • vlm - 视觉语言模型解析模式

默认:scan

表格格式 (table_flavor)

  • html - 按 HTML 语法输出表格
  • md - 按 Markdown 语法输出表格
  • none - 不进行表格识别

默认:html

获取图片 (get_image)

  • none - 不返回任何图像
  • page - 返回每一页的整页图像
  • objects - 返回页面内的子图像
  • both - 返回整页图像和图像对象

默认:objects

标题层级 (apply_document_tree)

  • 1 - 生成标题层级
  • 0 - 不生成标题

默认:1

公式识别 (formula_level)

  • 0 - 全识别
  • 1 - 仅识别行间公式
  • 2 - 不识别

默认:0

去水印 (remove_watermark)

  • 0 - 不去水印
  • 1 - 去水印

默认:0

图表识别 (apply_chart)

  • 0 - 不开启图表识别
  • 1 - 开启图表识别,以表格形式输出

默认:0

其他常用参数

  • pdf_pwd - PDF 密码(加密文档时使用)
  • page_start - 从第几页开始解析(PDF 时有效)
  • page_count - 解析的页数(默认 1000,最大 1000)
  • dpi - 坐标基准(72/144/216,默认 144)
  • get_excel - 是否返回 Excel(0 或 1)
  • crop_dewarp - 是否切边矫正(0 或 1)
  • markdown_details - 是否返回 detail 字段(0 或 1,默认 1)
  • page_details - 是否返回 pages 字段(0 或 1,默认 1)

使用示例

基础用法

帮我解析这个PDF文件

指定参数

用 parse 模式解析这个PDF
用 lite 模式解析,输出 markdown 表格
解析这个文件并提取目录

错误码处理

常见错误:

  • 40101 - App ID 或 Secret 为空
  • 40102 - App ID 或 Secret 无效
  • 40003 - 余额不足
  • 40303 - 文件类型不支持

如遇错误,请检查凭证是否正确,或咨询用户。

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务