低成本VisionMeta:Meta: Llama 3.2 11B Vision Instruct — 多模态视觉模型Meta: Llama 3.2 11B Vision Instruct是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备视觉理解、开源能力,上下文窗口131K tokens,最大输出16K tokens,输入价格$0.24/百万tokens。OpenRouter·开源0视觉理解低成本视觉多模态 申请 KEY API 文档厂商OpenRouter 模型参数 训练截止: 2023-12-30T16:00:00.000Z输入模态: 文本 图片输出模态: 文本 能力矩阵 上下文窗口: 131.1K 最大输出: 16.4K 视觉输入0 流式输出00 定价与计费计费方式: 按量付费输入价格: $0.2450/百万token输出价格: $0.2450/百万token0查看 Meta: 系列全部模型 →数据来源:openrouter_api ↗ · 中文优化:龙虾技能库