数据处理脚本生成器
v1.0.0自动化生成数据处理脚本。根据用户提供的 Excel 模板 + ERP 导出数据,生成 Python 脚本自动处理数据并生成报表。 当用户说"帮我生成数据处理脚本"、"做一个自动处理数据的脚本"、"根据模板生成脚本"时使用此 技能。 也适用于用户已有 Excel 底板和导出数据,想要自动化处理流程的场景。
运行时依赖
安装命令
点击复制技能文档
自动化数据处理脚本生成 目标
根据用户提供的 Excel 模板 + ERP 导出数据,自动生成可运行的数据处理脚本。
核心流程 第一步:获取素材(让用户提供)
必须向用户确认并获取:
Excel 模板文件(底板) — 包含格式、透视表、公式等 ERP 导出数据的样本 — CSV 或 Excel,需要知道是哪个 sheet
先读取文件,分析结构(sheet、列名、数据格式),才能继续后续步骤
第二步:确认处理逻辑(反复确认) 确认项 说明 数据来源 ERP 导出是什么格式?CSV 还是 Excel?是哪个 sheet? 清洗规则 哪些行需要过滤?(如:空代码、零库存) 计算字段 需要计算什么派生字段?(如:周转天数、周转判断) 追加还是覆盖 每天生成新文件,还是追加到同一个文件? 特殊逻辑 有没有其他特殊处理逻辑? 第三步:确认映射关系 确认项 说明 基准表 模板中哪个 sheet 是「基准」?包含什么映射?(产品代码 → 品类/供应商) 字段对应 导出数据的各列对应模板的哪些列? 第四步:确认文件路径(反复确认) 确认项 说明 导出文件夹路径 ERP 导出文件放在哪里? 模板文件路径 底板/基准表在哪里? 输出文件夹路径 生成的报表输出到哪里?
⚠️ 路径必须固定,如果后续调整,需要修改脚本中的路径变量
第五步:确认文件命名规范 确认项 说明 导出文件命名 每天导出的文件名前缀是什么?如 商品库存导出-2026-04-02.csv 模板文件命名 底板必须叫 XXX-底板.xlsx,累积文件叫 XXX-汇总.xlsx 输出文件命名 每天生成的文件名叫什么?如 每日库存提醒-2026-04-02.xlsx 第六步:确认编码 CSV 文件是什么编码?(默认 gb18030) 第七步:提醒用户(必须告知)
⚠️ 透视表:必须在底板中设置「打开文件时自动刷新」
右键透视表 → 数据透视表选项 → 数据 → 勾选「打开文件时自动刷新」
⚠️ VLOOKUP:禁止使用,因为打开文件时不会自动刷新
必须在脚本里直接写入计算好的值,不能用 Excel 公式 第八步:生成脚本
根据确认的信息生成 Python 脚本,脚本需要包含:
路径变量统一放在文件开头,方便后续修改 自动查找当天导出的文件(根据日期匹配) 多编码尝试(gb18030 → gbk → utf-8) 加载基准映射表 数据清洗逻辑 计算派生字段 通过 zip/XML 写入 Excel,保留底板的格式、切片器、透视表 第九步:测试运行 脚本生成后,先跑一遍验证是否正常 如果报错,修复后再交付 第十步:交付说明
告诉用户:
脚本放在哪里 怎么运行(python3 xxx.py) 如果路径变了改哪里(脚本开头的路径变量) 文件夹结构和命名规范 脚本规范参考 # 路径统一放在文件开头,方便修改 导出_DIR = "/Users/Zhuanz/xxx/每日导出数据" TEMPLATE_PATH = "/Users/Zhuanz/xxx/每日报表/xxx-底板.xlsx" 输出_DIR = "/Users/Zhuanz/xxx/每日报表"
# 命名规范 # - 底板: XXX-底板.xlsx # - 累积: XXX-汇总.xlsx # - 导出: 导出XXX-YYYY-MM-DD.csv # - 输出: XXX-YYYY-MM-DD.xlsx
关键原则 先获取素材,再确认逻辑 先确认逻辑,再确认路径 路径、命名必须反复确认 透视表和 VLOOKUP 的问题必须告知用户 生成的脚本路径要统一放在文件开头,方便后续修改 生成后必须测试运行,验证无误再交付