Dxf Text Extractor — Dxf Text 提取器

v1.0.0

提取并清理建筑结构CAD DXF文件中的文本，自动将探索者（TSSD）等特殊钢筋符号映射为标准规范（如HRB400）。当用户上传DXF文件，或要求“提取DXF文字”、“解析结构图纸”、“读取CAD文本”、“处理结构说明”时触发使用。

0· 0·0 当前·0 累计

by @lialia691691-alt

生产力工具

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install dxf-text-extractor

镜像加速npx clawhub@latest install dxf-text-extractor --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

DXF 结构文本提取器 (DXF Text 提取器) 执行指令 (Instructions) 第一步：验证输入文件

确保用户提供了有效的 .dxf 文件。如果用户提供的是 .dwg 文件，请委婉地提示其先通过 AutoCAD 或第三方批量转换工具将其另存为 .dxf 格式，因为本技能仅严格处理 DXF 文件，不处理包含加密或代理图元的 DWG 源文件。

第二步：运行环境检查

在运行脚本前，确认后台环境中已正确安装 ezdxf Python 依赖库。如未安装，请静默执行 pip 安装 ezdxf。

第三步：执行提取脚本

运行自带的 Python 脚本来解析 DXF 文件，提取所有的单行文字（TEXT）和多行文字（MTEXT）图元。该脚本会自动剥离所有几何线段（如 LINE、POLYLINE），并对天正/探索者（TSSD）字体的特殊钢筋符号（如 %%132）进行国标化转换。

请执行以下命令行指令： python scripts/提取_text.py [文件绝对路径.dxf]

第四步：格式化输出结果

脚本会将提取出的无序文本输出为干净的 Markdown 列表结构。请直接将此输出结果完整返回给用户，切勿进行任何大模型的主观总结、缩减或数据遗漏。必须确保《结构设计总说明》的各项参数以及梁板柱的构件标识保持绝对完整，以便下游模块进行清单组价及特征匹配。

使用示例 (Examples)

用户输入： "请帮我提取这张二层梁平法施工图 DXF 里的标注文字。" 执行动作：

确认收到图纸文件。运行脚本：python scripts/提取_text.py 2F_梁平法施工图.dxf。输出包含诸如 - 梁混凝土强度等级: C30 以及 - KL1(3) 300x500 等完整结构信息的 Markdown 列表。常见报错处理 (Troubleshooting)

报错信息： ezdxf.lldxf.验证器.DXFStructureError 可能原因：上传的图纸文件已损坏，或为二进制格式，并非有效的 ASCII 编码 DXF 文件。解决方案：提示用户在 AutoCAD 中打开原图，执行 SAVEAS (另存为) 命令，并明确在文件类型下拉菜单中选择 "AutoCAD 2013/LT2013 DXF (*.dxf)" 格式后重新上传。

报错信息：脚本运行成功，但输出结果中仍存在 %%130、\U+00A2 等无法识别的乱码符号。可能原因：图纸中包含了当前脚本内部字典尚未覆盖的设计院自定义字体映射。解决方案：询问用户该符号在图纸说明中代表的具体钢筋级别（如 HPB300），并建议用户将该映射关系手动补充到 scripts/提取_text.py 脚本头部的 REBAR_SYMBOL_MAP 字典常量中，以沉淀项目经验。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库