首页AI模型目录

AI 模型

浏览主流大模型,了解能力与定价。

热门搜索 GPTClaudeDeepSeek通义千问文心一言Gemini

定价: budget · 标签: 视觉理解

Kimi-K2.5 — 多模态视觉模型SiliconFlow低成本Kimi-K2开源
Kimi-K2.5是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Kimi K2,上下文窗口262K tokens,支持流式输出和API调用。
262.1K文本 图片视觉理解低成本国产
Llama-4-Scout-17B-16E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Scout-17B-16E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Scout MoE model with 16 experts,上下文窗口328K tokens,支持流式输出和API调用。
327.7K 17B x 16E文本 图片视觉理解低成本国产
Llama-4-Maverick-17B-128E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Maverick-17B-128E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Maverick large MoE model with 128 experts,上下文窗口1.0M tokens,支持流式输出和API调用
1.0M 17B x 128E文本 图片视觉理解低成本国产
Qwen3-VL-235B-A22B-Instruct — 多模态视觉模型SiliconFlow低成本Qwen3开源
Qwen3-VL-235B-A22B-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Qwen3 VL 235B multimodal vision-language model,上下文窗口131K tokens,支持流式输出和API调用。
131.1K文本 图片视觉理解低成本国产
GLM-5V-Turbo — 多模态视觉模型SiliconFlowTurbo低成本GLM-5开源
GLM-5V-Turbo是通过SiliconFlow(硅基流动)平台提供的开源AI模型,GLM-5V-Turbo is Z,上下文窗口203K tokens,支持流式输出和API调用。
202.8K文本 图片视觉理解低成本国产
Anthropic: Claude 3.5 Haiku — 多模态视觉模型OpenRouter低成本Anthropic:
Anthropic: Claude 3.5 Haiku是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口200K tokens,最大输出8K tokens,输入价格$0.80/百万tokens。
200K文本 图片视觉理解低成本视觉
Amazon: Nova Pro 1.0 — 多模态视觉模型OpenRouterPro低成本Amazon:
Amazon: Nova Pro 1.0是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口300K tokens,最大输出5K tokens,输入价格$0.80/百万tokens。
300K文本 图片视觉理解低成本视觉
Qwen: Qwen2.5 VL 72B Instruct — 多模态视觉模型OpenRouter低成本Qwen:开源
Qwen: Qwen2.5 VL 72B Instruct是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备视觉理解、开源能力,上下文窗口33K tokens,最大输出33K tokens,输入价格$0.80/百万tokens。
32.8K文本 图片视觉理解低成本视觉
OpenAI: GPT-5.4 Mini — 多模态视觉模型OpenRouterMini低成本OpenAI: 思考
OpenAI: GPT-5.4 Mini是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$0.75/百万tokens。
400K图片 文本视觉理解低成本推理
Z.ai: GLM 4.5V — 多模态视觉模型OpenRouter低成本Z.ai: 思考开源
Z.ai: GLM 4.5V是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口66K tokens,最大输出16K tokens,输入价格$0.60/百万tokens。
65.5K文本 图片视觉理解低成本推理
Baidu: ERNIE 4.5 VL 424B A47B — 多模态视觉模型OpenRouter低成本Baidu: 思考开源
Baidu: ERNIE 4.5 VL 424B A47B 是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解、开源能力,上下文窗口123K tokens,最大输出16K tokens,输入价格$0.42/百万tokens。
123K图片 文本视觉理解低成本推理
Qwen: Qwen3.6 Plus — 多模态视觉模型OpenRouterPlus低成本Qwen: 思考
Qwen: Qwen3.6 Plus是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出66K tokens,输入价格$0.33/百万tokens。
1M文本 图片 视频视觉理解低成本推理
Mistral: Mistral Small 3.1 24B — 多模态视觉模型OpenRouter低成本Mistral 思考开源
Mistral: Mistral Small 3.1 24B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解、开源能力,上下文窗口128K tokens,输入价格$0.35/百万tokens。
128K文本 图片视觉理解低成本推理
MoonshotAI: Kimi K2.5 — 多模态视觉模型OpenRouter低成本MoonshotAI: 思考开源
MoonshotAI: Kimi K2.5是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口262K tokens,最大输出66K tokens,输入价格$0.38/百万tokens。
262.1K文本 图片视觉理解低成本推理
Qwen: Qwen3.5 397B A17B — 多模态视觉模型OpenRouter低成本Qwen: 思考开源
Qwen: Qwen3.5 397B A17B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口262K tokens,最大输出66K tokens,输入价格$0.39/百万tokens。
262.1K文本 图片 视频视觉理解低成本推理
Xiaomi: MiMo-V2-Omni — 多模态视觉模型OpenRouter低成本Xiaomi: 思考
Xiaomi: MiMo-V2-Omni是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口262K tokens,最大输出66K tokens,输入价格$0.40/百万tokens。
262.1K文本 音频 图片 视频视觉理解低成本推理
Mistral: Mistral Medium 3.1 — 多模态视觉模型OpenRouter低成本Mistral
Mistral: Mistral Medium 3.1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口131K tokens,输入价格$0.40/百万tokens。
131.1K文本 图片视觉理解低成本视觉
Mistral: Mistral Large 3 2512 — 多模态视觉模型OpenRouter低成本Mistral
Mistral: Mistral Large 3 2512是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口262K tokens,输入价格$0.50/百万tokens。
262.1K文本 图片视觉理解低成本视觉
Google: Gemini 3 Flash Preview — 多模态视觉模型OpenRouterFlash低成本Google: 思考
Google: Gemini 3 Flash Preview是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出66K tokens,输入价格$0.50/百万tokens。
1.0M文本 图片 音频 视频视觉理解低成本推理
OpenAI: GPT-4.1 Mini — 多模态视觉模型OpenRouterMini低成本OpenAI:
OpenAI: GPT-4.1 Mini是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出33K tokens,输入价格$0.40/百万tokens。
1.0M图片 文本视觉理解低成本视觉
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务