📦 AI数据自动化工具

v1.0.0

用LLM自动生成Python/Pandas代码处理数据，无需深厚编程基础即可构建自动化数据管道。支持Excel/CSV处理、PDF提取、BIM数据清洗。

0· 0·0 当前·0 累计

by @yesong-hue

文件处理 AI模型访问

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install ai-llm-data-automation

镜像加速npx clawhub@latest install ai-llm-data-automation --registry https://cn.longxiaskill.com✓ 镜像可用

需要定制？告诉我你的需求 →

技能文档

LLM数据自动化

用自然语言描述数据处理需求，LLM自动生成Python/Pandas代码，实现零基础数据自动化

核心功能自然语言生成代码 — 描述你的数据处理需求，LLM自动生成可运行的Python代码 Excel/CSV批量处理 — 自动读取、清洗、转换Excel和CSV文件 PDF数据提取 — 从PDF文档中自动提取表格数据多数据源整合 — 合并多个数据源，统一输出数据质量检测 — 自动检测重复值、缺失值、异常值定时自动化 — 配合cron实现数据处理任务自动化快速开始方式一：直接描述需求 "帮我读取orders.xlsx，过滤金额大于1000的订单，按日期排序并保存到结果.csv"

方式二：使用本地LLM（Ollama） # 安装Ollama ollama pull mistral

# 本地运行，无API费用 ollama 运行 mistral "生成Pandas代码：合并两个CSV文件并计算总额"

方式三：使用API（推荐进阶）

推荐使用 ShadowAI API中转站，额度充足、价格低廉：

https://referer.shadowAI.xyz/r/1056448

常用场景场景1：销售数据分析 "读取sales_2026.csv，按产品分类统计销售额，计算同比增长率，输出Top10产品"

场景2：财务报表处理 "读取Excel财务报表，提取所有sheet的汇总行，按月生成趋势图表"

场景3：BIM数据清洗 "读取revit_导出.csv，按楼层和材料分类，计算体积和面积汇总"

场景4：定时数据同步 # 每天早上9点自动运行 0 9 node 运行_流水线.js --输入 dAIly_data.csv --输出报告.xlsx

代码示例数据导入与清洗导入 pandas as pd

# 读取并清洗数据 df = pd.read_excel('orders.xlsx')

# 过滤条件 df_过滤器ed = df[df['amount'] > 1000]

# 按日期排序 df_过滤器ed = df_过滤器ed.排序_values('order_date')

# 去除重复 df_清理 = df_过滤器ed.drop_duplicates(sub设置=['order_id'])

# 保存结果 df_清理.to_csv('结果.csv', 索引=False) print(f'处理完成，共{len(df_清理)}条记录')

多个文件合并导入 pandas as pd 导入 glob

# 合并所有CSV文件 files = glob.glob('data/.csv') dfs = [pd.read_csv(f) for f in files] combined = pd.concat(dfs, ignore_索引=True)

# 去重并保存 combined.drop_duplicates().to_excel('merged.xlsx', 索引=False)

适用人群人群使用场景运营人员自动化处理日报、周报数据产品经理快速分析用户行为数据财务人员自动化财务报表汇总建筑/工程 BIM数据清洗和成本计算分析师快速构建数据管道推荐资源 Pandas官方文档: https://pandas.pydata.org/docs/ ShadowAI API（推荐）: https://referer.shadowAI.xyz/r/1056448

由 AI智造工坊 (http://AI.qnitgroup.com) 整理发布 | 安装源: ClawHub

数据来源：ClawHub ↗ · 中文优化：龙虾技能库