首页AI模型目录

AI 模型

浏览主流大模型,了解能力与定价。

热门搜索 GPTClaudeDeepSeek通义千问文心一言Gemini

标签: 多模态

Kimi-K2.5 — 多模态视觉模型SiliconFlow低成本Kimi-K2开源
Kimi-K2.5是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Kimi K2,上下文窗口262K tokens,支持流式输出和API调用。
262.1K文本 图片开源长文本多模态
Llama-4-Scout-17B-16E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Scout-17B-16E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Scout MoE model with 16 experts,上下文窗口328K tokens,支持流式输出和API调用。
327.7K 17B x 16E文本 图片开源长文本性价比
Llama-4-Maverick-17B-128E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Maverick-17B-128E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Maverick large MoE model with 128 experts,上下文窗口1.0M tokens,支持流式输出和API调用
1.0M 17B x 128E文本 图片开源长文本性价比
Qwen3-VL-235B-A22B-Instruct — 多模态视觉模型SiliconFlow低成本Qwen3开源
Qwen3-VL-235B-A22B-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Qwen3 VL 235B multimodal vision-language model,上下文窗口131K tokens,支持流式输出和API调用。
131.1K文本 图片开源长文本性价比
GLM-5V-Turbo — 多模态视觉模型SiliconFlowTurbo低成本GLM-5开源
GLM-5V-Turbo是通过SiliconFlow(硅基流动)平台提供的开源AI模型,GLM-5V-Turbo is Z,上下文窗口203K tokens,支持流式输出和API调用。
202.8K文本 图片开源长文本性价比
OpenAI: GPT-5 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$15.00/百万tokens。
400K图片 文本长文本多模态深度思考
Anthropic: Claude Opus 4.6 — 多模态视觉模型OpenRouter中等Anthropic: 思考
Anthropic: Claude Opus 4.6是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出128K tokens,输入价格$5.00/百万tokens。
1M文本 图片长文本多模态深度思考
Anthropic: Claude Opus 4.5 — 多模态视觉模型OpenRouter中等Anthropic: 思考
Anthropic: Claude Opus 4.5是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出64K tokens,输入价格$5.00/百万tokens。
200K图片 文本长文本多模态深度思考
OpenAI: GPT-5 Image — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: GPT-5 Image是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$10.00/百万tokens。
400K图片 文本长文本多模态深度思考
OpenAI: o3 Deep Research — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: o3 Deep Research是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$10.00/百万tokens。
200K图片 文本长文本多模态深度思考
Anthropic: Claude Opus 4.1 — 多模态视觉模型OpenRouter高端Anthropic: 思考
Anthropic: Claude Opus 4.1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出32K tokens,输入价格$15.00/百万tokens。
200K图片 文本长文本多模态深度思考
OpenAI: o1 — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: o1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$15.00/百万tokens。
200K文本 图片长文本多模态深度思考
OpenAI: o1-pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: o1-pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$150.00/百万tokens。
200K文本 图片长文本多模态深度思考
OpenAI: GPT-5.4 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5.4 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.1M tokens,最大输出128K tokens,输入价格$30.00/百万tokens。
1.1M文本 图片长文本多模态深度思考
OpenAI: GPT-5.2 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5.2 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$21.00/百万tokens。
400K图片 文本长文本多模态深度思考
Anthropic: Claude Opus 4 — 多模态视觉模型OpenRouter高端Anthropic: 思考
Anthropic: Claude Opus 4是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出32K tokens,输入价格$15.00/百万tokens。
200K图片 文本长文本多模态深度思考
OpenAI: o3 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: o3 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$20.00/百万tokens。
200K文本 图片长文本多模态深度思考
OpenAI: GPT-4.1 — 多模态视觉模型OpenRouter中等OpenAI: 思考
OpenAI: GPT-4.1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,输入价格$2.00/百万tokens。
1.0M图片 文本长文本多模态深度思考
Perplexity: Sonar Reasoning Pro — 多模态视觉模型OpenRouterPro中等Perplexity: 思考
Perplexity: Sonar Reasoning Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解能力,上下文窗口128K tokens,输入价格$2.00/百万tokens。
128K文本 图片长文本多模态深度思考
Mistral: Pixtral Large 2411 — 多模态视觉模型OpenRouter中等Mistral
Mistral: Pixtral Large 2411是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口131K tokens,输入价格$2.00/百万tokens。
131.1K文本 图片长文本多模态API接入
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务