DeepSeek R1 Distill Llama 70B是通过Groq LPU极速推理平台提供的开源AI模型,Reasoning-focused model distilled from DeepSeek R1 into Llama 70B architecture,推理速度可达275 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
Groq·开源0
LPU 极速推理: 275tokens/sec
模型参数
推理速度: 275~275 token/s
输入模态: 文本
输出模态: 文本
能力矩阵
上下文窗口: 131.1K
最大输出: 16.4K
0 函数调用
流式输出
0 思考模式
定价与计费
计费方式: 按量付费
输入价格: $0.7500/百万token
输出价格: $0.9900/百万token
数据来源:groq_web ↗ · 中文优化:龙虾技能库