首页模型Llama-3.1Llama 3.1 8B Instant — 超高速推理模型
低成本Llama-3.1Groq LPU 极速推理,Meta开源模型

Llama 3.1 8B Instant — 超高速推理模型

Llama 3.1 8B Instant是通过Groq LPU极速推理平台提供的开源AI模型,Llama 3,推理速度可达840 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。

Groq·开源0

模型参数

推理速度: 840~840 token/s

能力矩阵

上下文窗口: 131.1K
最大输出: 8.2K
0
函数调用
流式输出
00

定价与计费

计费方式: 按量付费
输入价格: $0.0500/百万token
输出价格: $0.0800/百万token
0
查看 Llama-3.1 系列全部模型 →
数据来源groq_web · 中文优化:龙虾技能库