定价: budget · 标签: 大语言模型
Qwen3-235B-A22B — 开源对话模型SiliconFlow低成本Qwen3开源
Qwen3-235B-A22B是通过SiliconFlow(硅基流动)平台提供的开源AI模型,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 235B (22B active)文本对话低成本国产
Llama 3.2 3B — 超高速推理模型Groq低成本Llama-3.2开源
Llama 3.2 3B是通过Groq LPU极速推理平台提供的开源AI模型,Llama 3,推理速度可达900 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 900~900 t/s文本对话低成本函数调用
GPT OSS 120B — 超高速推理模型Groq低成本GPT开源
GPT OSS 120B是通过Groq LPU极速推理平台提供的开源AI模型,OpenAI flagship open-weight 117B MoE model with 5,推理速度可达500 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 500~500 t/s文本对话低成本大语言模型
Mistral Saba 24B — 极速推理模型Groq低成本Mistral开源
Mistral Saba 24B是通过Groq LPU极速推理平台提供的开源AI模型,Mistral Saba 24B efficient model for the Middle East and South Asia,推理速度可达330 tokens/sec,上下文窗口33K tokens,支持
32.8K 330~330 t/s文本对话低成本函数调用
Gemma 2 9B — 超高速推理模型Groq低成本Gemma开源
Gemma 2 9B是通过Groq LPU极速推理平台提供的开源AI模型,Google Gemma 2 9B open-source model for instruction following,推理速度可达500 tokens/sec,上下文窗口8K tokens,支持流式输出和API调用。
8.2K 500~500 t/s文本对话低成本大语言模型
QwQ 32B — 极速推理模型Groq低成本QwQ 思考开源
QwQ 32B是通过Groq LPU极速推理平台提供的开源AI模型,QwQ 32B reasoning model with strong chain-of-thought capabilities,推理速度可达400 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用
131.1K 400~400 t/s文本对话低成本推理
DeepSeek R1 Distill Llama 70B — 极速推理模型Groq低成本DeepSeek 思考开源
DeepSeek R1 Distill Llama 70B是通过Groq LPU极速推理平台提供的开源AI模型,Reasoning-focused model distilled from DeepSeek R1 into Llama 70B architecture,推理速度可达275 token
131.1K 275~275 t/s文本对话低成本推理
Llama 4 Maverick — 极速推理模型Groq低成本Llama-4开源
Llama 4 Maverick是通过Groq LPU极速推理平台提供的开源AI模型,推理速度可达240 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 240~240 t/s文本对话低成本函数调用
Llama 4 Scout — 超高速推理模型Groq低成本Llama-4开源
Llama 4 Scout是通过Groq LPU极速推理平台提供的开源AI模型,Meta Llama 4 Scout MoE model with 17B active parameters and 16 experts,推理速度可达594 tokens/sec,上下文窗口131K tokens,支
131.1K 594~594 t/s文本对话低成本函数调用
Llama 3.1 70B Versatile — 极速推理模型Groq低成本Llama-3.1开源
Llama 3.1 70B Versatile是通过Groq LPU极速推理平台提供的开源AI模型,Llama 3,推理速度可达250 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 250~250 t/s文本对话低成本函数调用
Llama 3.1 8B Instant — 超高速推理模型Groq低成本Llama-3.1开源
Llama 3.1 8B Instant是通过Groq LPU极速推理平台提供的开源AI模型,Llama 3,推理速度可达840 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
131.1K 840~840 t/s文本对话低成本函数调用
Arcee AI: Virtuoso Large — 高级对话模型OpenRouter低成本Arcee 思考
Arcee AI: Virtuoso Large是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、函数调用能力,上下文窗口131K tokens,最大输出64K tokens,输入价格$0.75/百万tokens。
131.1K文本对话低成本推理
OpenAI: GPT Audio Mini — 高级对话模型OpenRouterMini低成本OpenAI:
OpenAI: GPT Audio Mini是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备函数调用能力,上下文窗口128K tokens,最大输出16K tokens,输入价格$0.60/百万tokens。
128K文本 音频对话低成本函数调用
Qwen: Qwen3 Max Thinking — 高级对话模型OpenRouterThinking低成本Qwen: 思考
Qwen: Qwen3 Max Thinking是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、函数调用能力,上下文窗口262K tokens,最大输出33K tokens,输入价格$0.78/百万tokens。
262.1K文本对话低成本推理
Z.ai: GLM 5 — 高级对话模型OpenRouter低成本Z.ai: 思考开源
Z.ai: GLM 5是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、函数调用、开源能力,上下文窗口80K tokens,最大输出131K tokens,输入价格$0.72/百万tokens。
80K文本对话低成本推理
DeepSeek: R1 — 高级对话模型OpenRouter低成本DeepSeek 思考开源
DeepSeek: R1是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、函数调用、开源能力,上下文窗口64K tokens,最大输出16K tokens,输入价格$0.70/百万tokens。
64K文本对话低成本推理
DeepSeek: R1 Distill Llama 70B — 高级对话模型OpenRouter低成本DeepSeek 思考开源
DeepSeek: R1 Distill Llama 70B是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、开源能力,上下文窗口131K tokens,最大输出16K tokens,输入价格$0.70/百万tokens。
131.1K文本对话低成本推理
AionLabs: Aion-1.0-Mini — 高级对话模型OpenRouterMini低成本AionLabs: 思考开源
AionLabs: Aion-1.0-Mini是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、开源能力,上下文窗口131K tokens,最大输出33K tokens,输入价格$0.70/百万tokens。
131.1K文本对话低成本推理
Qwen2.5 Coder 32B Instruct — 高级对话模型OpenRouterCode低成本Qwen2 思考开源
Qwen2.5 Coder 32B Instruct是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、开源能力,上下文窗口33K tokens,输入价格$0.66/百万tokens。
32.8K文本对话低成本推理
Z.ai: GLM 4.5 — 高级对话模型OpenRouter低成本Z.ai: 思考开源
Z.ai: GLM 4.5是通过OpenRouter平台提供的AI模型,专注于文本对话与生成,具备深度推理、函数调用、开源能力,上下文窗口131K tokens,最大输出98K tokens,输入价格$0.60/百万tokens。
131.1K文本对话低成本推理
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制