AI 模型

615 个模型

Kimi-K2-Instruct-0905 — NVIDIA Build
Kimi K2 Instruct 0905 是月之暗面 (Moonshot AI) 推出的指令微调大语言模型,针对指令遵循和工具使用进行了优化,在 NVIDIA Build 平台上提供免费 API 端点。
Moonshot AI
Kimi-K2-Thinking — NVIDIA Build
Kimi K2 Thinking 是月之暗面 (Moonshot AI) 推出的先进推理模型,具备深度思维链能力,在 NVIDIA Build 平台上提供免费 API 端点。
Moonshot AI
DeepSeek-V3.2 — NVIDIA Build
DeepSeek V3.2 是深度求索 (DeepSeek AI) 推出的强大大语言模型,具备高级推理和函数调用能力,在 NVIDIA Build 平台上提供免费 API 端点。
DeepSeek AI
GLM-4.7 — NVIDIA Build
GLM-4.7 是智谱 AI (Z.ai) 推出的强大大语言模型,具备高级函数调用和代码生成能力,在 NVIDIA Build 平台上提供免费 API 端点。
Z.ai
GLM-5 — NVIDIA Build
GLM-5 是智谱 AI (Z.ai) 推出的强大大语言模型,具备高级推理和函数调用能力,在 NVIDIA Build 平台上提供免费 API 端点。
Z.ai
Qwen3.5-397B-A17B — NVIDIA Build
Qwen3.5-397B-A17B 是通义千问推出的大规模 MoE 架构大语言模型,总参数 397B、激活参数 17B,在推理和多语言任务上表现卓越,在 NVIDIA Build 平台上提供免费 API 端点。
Qwen
MiniMax-M2.5 — NVIDIA Build
MiniMax M2.5 是 MiniMax 推出的强大大语言模型,在 NVIDIA Build 平台上提供免费 API 端点。
MiniMax
Qwen3.5-122B-A10B — NVIDIA Build
Qwen3.5-122B-A10B 是通义千问推出的 MoE 架构大语言模型,总参数 122B、激活参数 10B,具备强大的多语言和推理能力,在 NVIDIA Build 平台上提供免费 API 端点。
Qwen
MiniMax-M2.7 — NVIDIA Build
MiniMax M2.7 是 MiniMax 推出的强大大语言模型,具备高级推理能力,在 NVIDIA Build 平台上提供免费 API 端点。
MiniMax
Llama 3 70B — 极速推理模型
Llama 3 70B是通过Groq LPU极速推理平台提供的开源AI模型,Llama 3 70B instruction-tuned model with 8K context,推理速度可达330 tokens/sec,上下文窗口8K tokens,支持流式输出和API调用。
Groq
Qwen3-Coder-480B-A35B — 开源对话模型
Qwen3-Coder-480B-A35B是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Qwen3 Coder 480B A35B large code-focused MoE model,上下文窗口262K tokens,支持流式输出和API调用。
SiliconFlow
Qwen3 32B — 超高速推理模型
Qwen3 32B是通过Groq LPU极速推理平台提供的开源AI模型,Qwen3 32B dense model with strong multilingual and reasoning capabilities,推理速度可达662 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
Groq
GPT OSS Safeguard 20B — 超高速推理模型
GPT OSS Safeguard 20B是通过Groq LPU极速推理平台提供的开源AI模型,Safety reasoning model from OpenAI for content classification and LLM filtering,推理速度可达1000 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
Groq
GPT OSS 20B — 超高速推理模型
GPT OSS 20B是通过Groq LPU极速推理平台提供的开源AI模型,OpenAI open-weight 21B MoE model with 3,推理速度可达1000 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。
Groq
Kimi-K2-Instruct — 开源对话模型
Kimi-K2-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,上下文窗口131K tokens,支持流式输出和API调用。
SiliconFlow
MiniMax-M2.5 — 开源对话模型
MiniMax-M2.5是通过SiliconFlow(硅基流动)平台提供的开源AI模型,MiniMax M2,上下文窗口197K tokens,支持流式输出和API调用。
SiliconFlow
Llama-3.1-8B-Instruct — 免费对话模型
Llama-3.1-8B-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,完全免费使用,Meta Llama 3,上下文窗口131K tokens,支持流式输出和API调用。
SiliconFlow
Qwen3-8B — 免费对话模型
Qwen3-8B是通过SiliconFlow(硅基流动)平台提供的开源AI模型,完全免费使用,Qwen3 8B compact model, free on SiliconFlow,上下文窗口131K tokens,支持流式输出和API调用。
SiliconFlow
GLM-5-0805 — 开源对话模型
GLM-5-0805是通过SiliconFlow(硅基流动)平台提供的开源AI模型,上下文窗口80K tokens,支持流式输出和API调用。
SiliconFlow
GLM-4.7-Flash — 免费对话模型
GLM-4.7-Flash是通过SiliconFlow(硅基流动)平台提供的开源AI模型,完全免费使用,GLM-4,上下文窗口203K tokens,支持流式输出和API调用。
SiliconFlow