低成本MistralGroq LPU 极速推理,Mistral开源模型Mistral Saba 24B — 极速推理模型Mistral Saba 24B是通过Groq LPU极速推理平台提供的开源AI模型,Mistral Saba 24B efficient model for the Middle East and South Asia,推理速度可达330 tokens/sec,上下文窗口33K tokens,支持流式输出和API调用。Groq·开源0对话低成本函数调用大语言模型LPU 极速推理: 330tokens/sec 申请 KEY API 文档厂商Groq 模型参数 推理速度: 330~330 token/s输入模态: 文本输出模态: 文本 能力矩阵 上下文窗口: 32.8K 最大输出: 8.2K0 函数调用 流式输出00 定价与计费计费方式: 按量付费输入价格: $0.7900/百万token输出价格: $0.7900/百万token0查看 Mistral 系列全部模型 →数据来源:groq_web ↗ · 中文优化:龙虾技能库