📦 AI数据自动化工具
v1.0.0用LLM自动生成Python/Pandas代码处理数据,无需深厚编程基础即可构建自动化数据管道。支持Excel/CSV处理、PDF提取、BIM数据清洗。
运行时依赖
安装命令
点击复制技能文档
LLM数据自动化
用自然语言描述数据处理需求,LLM自动生成Python/Pandas代码,实现零基础数据自动化
核心功能 自然语言生成代码 — 描述你的数据处理需求,LLM自动生成可运行的Python代码 Excel/CSV批量处理 — 自动读取、清洗、转换Excel和CSV文件 PDF数据提取 — 从PDF文档中自动提取表格数据 多数据源整合 — 合并多个数据源,统一输出 数据质量检测 — 自动检测重复值、缺失值、异常值 定时自动化 — 配合cron实现数据处理任务自动化 快速开始 方式一:直接描述需求 "帮我读取orders.xlsx,过滤金额大于1000的订单,按日期排序并保存到结果.csv"
方式二:使用本地LLM(Ollama) # 安装Ollama ollama pull mistral
# 本地运行,无API费用 ollama 运行 mistral "生成Pandas代码:合并两个CSV文件并计算总额"
方式三:使用API(推荐进阶)
推荐使用 ShadowAI API中转站,额度充足、价格低廉:
https://referer.shadowAI.xyz/r/1056448
常用场景 场景1:销售数据分析 "读取sales_2026.csv,按产品分类统计销售额,计算同比增长率,输出Top10产品"
场景2:财务报表处理 "读取Excel财务报表,提取所有sheet的汇总行,按月生成趋势图表"
场景3:BIM数据清洗 "读取revit_导出.csv,按楼层和材料分类,计算体积和面积汇总"
场景4:定时数据同步 # 每天早上9点自动运行 0 9 node 运行_流水线.js --输入 dAIly_data.csv --输出 报告.xlsx
代码示例 数据导入与清洗 导入 pandas as pd
# 读取并清洗数据 df = pd.read_excel('orders.xlsx')
# 过滤条件 df_过滤器ed = df[df['amount'] > 1000]
# 按日期排序 df_过滤器ed = df_过滤器ed.排序_values('order_date')
# 去除重复 df_清理 = df_过滤器ed.drop_duplicates(sub设置=['order_id'])
# 保存结果 df_清理.to_csv('结果.csv', 索引=False) print(f'处理完成,共{len(df_清理)}条记录')
多个文件合并 导入 pandas as pd 导入 glob
# 合并所有CSV文件 files = glob.glob('data/.csv') dfs = [pd.read_csv(f) for f in files] combined = pd.concat(dfs, ignore_索引=True)
# 去重并保存 combined.drop_duplicates().to_excel('merged.xlsx', 索引=False)
适用人群 人群 使用场景 运营人员 自动化处理日报、周报数据 产品经理 快速分析用户行为数据 财务人员 自动化财务报表汇总 建筑/工程 BIM数据清洗和成本计算 分析师 快速构建数据管道 推荐资源 Pandas官方文档: https://pandas.pydata.org/docs/ ShadowAI API(推荐): https://referer.shadowAI.xyz/r/1056448
由 AI智造工坊 (http://AI.qnitgroup.com) 整理发布 | 安装源: ClawHub