Text-to-Carousel — 文本转轮播

v1.0.0

从文本内容、文章或URL生成专业的社交媒体轮播图像（Instagram、LinkedIn、TikTok、Xiaohongshu）。当被要求创建轮播、创建幻灯片、制作社交媒体图形、将文章转换为轮播、从文本生成轮播、文本转换为轮播或制作Instagram/LinkedIn/TikTok轮播帖子时使用。支持中文、英文、马来语等多种语言。输出1024x1024 PNG/JPG图像。

0· 0·0 当前·0 累计

by @jiangyisheng9-bot·MIT-0

开发工具代码生成 CI/CD DevOps 系统工具

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install text-to-carousel

镜像加速npx clawhub@latest install text-to-carousel --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Text-to-Carousel 使用 Gemini 图像生成 API 从文本内容生成专业的轮播图像。要求 Gemini API 密钥，开启计费（查看 TOOLS.md 或询问用户）模型：gemini-3-pro-image-preview（必需，用于正确渲染中文/CJK 文本） VPN：如果 Gemini 返回位置错误，可能需要使用美国 VPN 工作流程

收集输入

从以下来源确定轮播内容：直接文本/项目符号从用户文章 URL（获取和提取关键点） WordPress 文章（通过 API 获取）用户提供的主题（生成内容）收集：品牌信息：名称、颜色、风格（查看 TOOLS.md 中已知品牌）产品图像：URL 或路径（用于 CTA幻灯片）幻灯片数量：默认 6 张大小：默认 1024x1024 语言：从内容中检测

计划幻灯片结构

对于健康/产品轮播，使用以下 6 幻灯片结构： # 类型目的 1 封面钩子 + 品牌 + 主题 2 问题为什么读者应该关心 3 解决方案产品/主题如何解决它 4 详情关键功能、数据、成分 5 社交证明评价、结果、证据 6 CTA 产品图像 + 购买/联系对于其他结构，请参阅 references/prompt-patterns.md。

编写提示

对于每个幻灯片，编写一个 Gemini 提示，遵循以下规则：设计提示结构：为 [品牌] 创建一个 [SIZE] [STYLE_PRESET] Instagram 幻灯片。布局：

背景：[COLORS/GRADIENT]
[元素描述，包含确切文本]
"[幻灯片编号] / [总数]" 底部右侧

关键规则：指定确切文本以渲染 —— 引用每个中文字符包含幻灯片编号（例如 "01 / 06"）引用品牌名称和一致的颜色调色板对于包含产品图像的 CTA 幻灯片：通过 API 调用中的 inlineData 附加图像有关样式预设和模板，请参阅 references/prompt-patterns.md。

生成图像

使用 scripts/generate_carousel.py 或直接调用 Gemini API：导入 urllib.request、json、base64 API_KEY = "..." # 从 TOOLS.md 中获取 MODEL = "gemini-3-pro-image-preview" # 必需，用于 CJK 文本 url = f"https://generativelanguage.googleapis.com/v1beta/models/{MODEL}:generateContent?key={API_KEY}" parts = [{"text": prompt}] # 对于包含产品图像的 CTA 幻灯片： # parts.insert(0, {"inlineData": {"mimeType": "image/jpeg", "data": base64_image}}) payload = { "contents": [{"parts": parts}], "generationConfig": {"responseModalities": ["image", "text"]} } data = json.dumps(payload).encode("utf-8") req = urllib.request.Request(url, data=data, headers={"Content-Type": "application/json"}) resp = urllib.request.urlopen(req, timeout=180) result = json.loads(resp.read()) 在幻灯片之间添加 5 秒延迟，以避免速率限制。

验证输出

生成后，使用视觉模型验证每个幻灯片：中文/CJK 文本准确性（字符级检查）设计的一致性跨幻灯片产品图像在 CTA 幻灯片上的可见性品牌元素的存在（标志、颜色、幻灯片编号）如果文本混乱，重新生成该幻灯片。专业模型很少在中文上失败，但仍要验证。模型选择指南模型中文文本设计质量速度使用时 gemini-3-pro-image-preview 完美高慢默认选择 —— CJK 内容 gemini-2.5-flash-image 混乱高快仅限英文内容 gemini-3.1-flash-image-preview 未测试高快尝试英文内容常见问题问题解决方案 429 配额超出检查计费是否链接到正确的 GCP 项目位置不支持使用美国 VPN 中文文本混乱切换到 gemini-3-pro-image-preview 产品图像不匹配通过 inlineData 附加实际产品图像设计不一致跨幻灯片包含品牌颜色十六进制代码和样式描述在每个提示中文件结构 text-to-carousel/ ├── SKILL.md # 本文件 ├── scripts/ │ └── generate_carousel.py # 批量生成脚本（配置驱动） └── references/ └── prompt-patterns.md # 设计预设，幻灯片模板，提示

License

运行时依赖

安装命令

技能文档

相关技能推荐