低成本QwQGroq LPU 极速推理,Qwen开源模型QwQ 32B — 极速推理模型QwQ 32B是通过Groq LPU极速推理平台提供的开源AI模型,QwQ 32B reasoning model with strong chain-of-thought capabilities,推理速度可达400 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。Groq·开源0 申请 KEY API 文档厂商Groq 模型参数 推理速度: 400~400 token/s 能力矩阵 上下文窗口: 131.1K 最大输出: 131.1K00 流式输出0 思考模式 定价与计费计费方式: 按量付费输入价格: $0.2900/百万token输出价格: $0.3900/百万token查看 QwQ 系列全部模型 →数据来源:groq_web ↗ · 中文优化:龙虾技能库