AI 模型

共 615 个模型

Kimi-K2-Instruct-0905 — NVIDIA Build

Kimi K2 Instruct 0905 是月之暗面 (Moonshot AI) 推出的指令微调大语言模型，针对指令遵循和工具使用进行了优化，在 NVIDIA Build 平台上提供免费 API 端点。

Kimi-K2-Thinking — NVIDIA Build

Kimi K2 Thinking 是月之暗面 (Moonshot AI) 推出的先进推理模型，具备深度思维链能力，在 NVIDIA Build 平台上提供免费 API 端点。

DeepSeek-V3.2 — NVIDIA Build

DeepSeek V3.2 是深度求索 (DeepSeek AI) 推出的强大大语言模型，具备高级推理和函数调用能力，在 NVIDIA Build 平台上提供免费 API 端点。

GLM-4.7 — NVIDIA Build

GLM-4.7 是智谱 AI (Z.ai) 推出的强大大语言模型，具备高级函数调用和代码生成能力，在 NVIDIA Build 平台上提供免费 API 端点。

GLM-5 — NVIDIA Build

GLM-5 是智谱 AI (Z.ai) 推出的强大大语言模型，具备高级推理和函数调用能力，在 NVIDIA Build 平台上提供免费 API 端点。

Qwen3.5-397B-A17B — NVIDIA Build

Qwen3.5-397B-A17B 是通义千问推出的大规模 MoE 架构大语言模型，总参数 397B、激活参数 17B，在推理和多语言任务上表现卓越，在 NVIDIA Build 平台上提供免费 API 端点。

MiniMax-M2.5 — NVIDIA Build

MiniMax M2.5 是 MiniMax 推出的强大大语言模型，在 NVIDIA Build 平台上提供免费 API 端点。

Qwen3.5-122B-A10B — NVIDIA Build

Qwen3.5-122B-A10B 是通义千问推出的 MoE 架构大语言模型，总参数 122B、激活参数 10B，具备强大的多语言和推理能力，在 NVIDIA Build 平台上提供免费 API 端点。

MiniMax-M2.7 — NVIDIA Build

MiniMax M2.7 是 MiniMax 推出的强大大语言模型，具备高级推理能力，在 NVIDIA Build 平台上提供免费 API 端点。

Llama 3 70B — 极速推理模型

Llama 3 70B是通过Groq LPU极速推理平台提供的开源AI模型，Llama 3 70B instruction-tuned model with 8K context，推理速度可达330 tokens/sec，上下文窗口8K tokens，支持流式输出和API调用。

Qwen3-Coder-480B-A35B — 开源对话模型

Qwen3-Coder-480B-A35B是通过SiliconFlow（硅基流动）平台提供的开源AI模型，Qwen3 Coder 480B A35B large code-focused MoE model，上下文窗口262K tokens，支持流式输出和API调用。

Qwen3 32B — 超高速推理模型

Qwen3 32B是通过Groq LPU极速推理平台提供的开源AI模型，Qwen3 32B dense model with strong multilingual and reasoning capabilities，推理速度可达662 tokens/sec，上下文窗口131K tokens，支持流式输出和API调用。

GPT OSS Safeguard 20B — 超高速推理模型

GPT OSS Safeguard 20B是通过Groq LPU极速推理平台提供的开源AI模型，Safety reasoning model from OpenAI for content classification and LLM filtering，推理速度可达1000 tokens/sec，上下文窗口131K tokens，支持流式输出和API调用。

GPT OSS 20B — 超高速推理模型

GPT OSS 20B是通过Groq LPU极速推理平台提供的开源AI模型，OpenAI open-weight 21B MoE model with 3，推理速度可达1000 tokens/sec，上下文窗口131K tokens，支持流式输出和API调用。

Kimi-K2-Instruct — 开源对话模型

Kimi-K2-Instruct是通过SiliconFlow（硅基流动）平台提供的开源AI模型，上下文窗口131K tokens，支持流式输出和API调用。

MiniMax-M2.5 — 开源对话模型

MiniMax-M2.5是通过SiliconFlow（硅基流动）平台提供的开源AI模型，MiniMax M2，上下文窗口197K tokens，支持流式输出和API调用。

Llama-3.1-8B-Instruct — 免费对话模型

Llama-3.1-8B-Instruct是通过SiliconFlow（硅基流动）平台提供的开源AI模型，完全免费使用，Meta Llama 3，上下文窗口131K tokens，支持流式输出和API调用。

Qwen3-8B — 免费对话模型

Qwen3-8B是通过SiliconFlow（硅基流动）平台提供的开源AI模型，完全免费使用，Qwen3 8B compact model, free on SiliconFlow，上下文窗口131K tokens，支持流式输出和API调用。

GLM-5-0805 — 开源对话模型

GLM-5-0805是通过SiliconFlow（硅基流动）平台提供的开源AI模型，上下文窗口80K tokens，支持流式输出和API调用。

GLM-4.7-Flash — 免费对话模型

GLM-4.7-Flash是通过SiliconFlow（硅基流动）平台提供的开源AI模型，完全免费使用，GLM-4，上下文窗口203K tokens，支持流式输出和API调用。

1 / 31