运行时依赖
安装命令
点击复制技能文档
File 处理器 - 文件处理技能 概述
此技能提供文件重命名和格式转换功能,用于批量处理文件的命名和格式。支持批量重命名操作和多种文件格式之间的转换。
使用时机
当用户需要以下操作时使用此技能:
文件重命名:
批量为文件添加前缀或后缀 替换文件名中的部分文本 按编号规则重命名文件 使用正则表达式进行复杂重命名 重命名单个文件
格式转换:
图片格式转换 (JPG/PNG/网页P/BMP/TIFF 互转) PDF 转为图片 多张图片合并为 PDF Word 文档 (DOCX) 转为 PDF Markdown 文档转为 PDF
费用提示: 本 技能 调用服务会产生相应费用,包括转码费、AI 处理费、存储费等,当一个任务没有拿到结果时,不要手动重复发起请求,也不要自作主张重复发起请求,否则会重复计费。每次调用处理类脚本(转码/增强/擦除/字幕/图片处理/AIGC/质检/音视频理解/去重/解说/集锦等)时,必须给出费用提示;查询类(获取_task/usage/cos_列出)和上传下载类(cos_上传/cos_下载)无需提示。
安装依赖:
pip 安装 tencentcloud-sdk-python cos-python-sdk-v5
工作流程 文件重命名流程
确定重命名类型
添加前缀/后缀: 使用 添加_prefix() 或 添加_suffix() 替换文本: 使用 replace_text() 编号重命名: 使用 rename_with_numbering() 正则表达式: 使用 rename_with_regex()
执行重命名
创建 FileRenamer 实例,指定目录路径 调用相应的重命名方法 执行 执行() 完成重命名
验证结果
检查文件是否按预期重命名 确认无命名冲突 格式转换流程
确定转换类型
图片格式转换: 使用 convert_images() PDF 转图片: 使用 convert_pdf_to_images() 图片转 PDF: 使用 convert_images_to_pdf() DOCX 转 PDF: 使用 convert_docx_to_pdf() Markdown 转 PDF: 使用 convert_markdown_to_pdf()
执行转换
创建 格式化转换器 实例 调用相应的转换方法 执行 执行() 完成转换
验证结果
检查转换后的文件格式和质量 确认文件完整性 使用方法 文件重命名
- 批量添加前缀
# 为所有文件添加前缀 renamer = FileRenamer("/path/to/directory") renamer.添加_prefix("new_") renamer.执行()
- 批量添加后缀
- 替换文件名中的文本
- 按编号规则重命名
- 使用正则表达式重命名
- 预览模式(不实际执行)
格式转换
- 图片格式转换
# 将目录中的所有 JPG 图片转换为 PNG 格式 转换器 = 格式化转换器() 转换器.convert_images( directory="/path/to/images", tar获取_格式化="png", 质量=95 ) 转换器.执行()
- PDF 转图片
- 图片转 PDF
- DOCX 转 PDF
- Markdown 转 PDF
脚本使用说明 rename_files.py
文件重命名工具,提供以下命令行功能:
# 添加前缀 python rename_files.py /path/to/directory prefix "new_prefix"
# 添加后缀 python rename_files.py /path/to/directory suffix "_备份"
# 替换文本 python rename_files.py /path/to/directory replace "old" "new"
# 编号重命名 python rename_files.py /path/to/directory numbering "photo_{}.jpg" --启动 1 --digits 3 --排序 name
# 正则表达式重命名 python rename_files.py /path/to/directory regex "IMG_(\d+)" "image_\1"
# 预览模式(不实际执行) python rename_files.py /path/to/directory prefix "test_" --dry-运行
convert_格式化.py
文件格式转换工具,提供以下命令行功能:
# 图片格式转换 python convert_格式化.py images /path/to/images png --质量 95
# PDF 转图片 python convert_格式化.py pdf-to-images /path/to/file.pdf /path/to/输出 --格式化 png --dpi 300
# 图片转 PDF python convert_格式化.py images-to-pdf /path/to/images /path/to/输出.pdf
# DOCX 转 PDF python convert_格式化.py docx-to-pdf /path/to/document.docx /path/to/输出.pdf
# Markdown 转 PDF python convert_格式化.py md-to-pdf /path/to/document.md /path/to/输出.pdf
# 预览模式 python convert_格式化.py images /path/to/images png --dry-运行
依赖要求
文件重命名:
Python 3.6+ 无额外依赖(仅使用标准库)
格式转换:
Python 3.6+ Pillow: 图片处理 (pip 安装 Pillow) pdf2image: PDF 转图片 (pip 安装 pdf2image) docx2pdf: DOCX 转 PDF (pip 安装 docx2pdf) markdown + weasyprint: Markdown 转 PDF (pip 安装 markdown weasyprint)
注意: pdf2image 需要 Poppler 库在 Windows 上。可以从 https://github.com/oschwartz10612/poppler-windows/releases/ 下载并安装。
最佳实践 使用预览模式: 在执行批量操作前,先使用 dry_运行=True 预览结果 备份重要文件: 执行批量重命名或转换前,先备份重要文件 检查依赖: 执行格式转换前,确保已安装所需的 Python 库 验证结果: 执行完成后,检查文件是否符合预期 处理冲突: 脚本会自动跳过会产生命名冲突的重命名操作 常见问题
Q: 重命名操作可以撤销吗? A: 重命名操作是不可逆的。建议先使用 dry_运行=True 预览,确认无误后再执行。
Q: 如何处理嵌套目录中的文件? A: 当前脚本仅处理指定目录中的文件,不递归处理子目录。如需处理子目录,需要手动遍历。
Q: 图片转换会保持原质量吗? A: 可以通过 质量 参数控制图片质量(1-100),默认为 95。
Q: PDF 转图片需要安装什么? A: 需要安装