首页龙虾技能列表 › TurboQuant+ KV Cache Compression — 6.4倍KV缓存压缩

TurboQuant+ KV Cache Compression — 6.4倍KV缓存压缩

v?

TurboQuant+ 在 Apple Silicon 上无损压缩 llama.cpp 的 KV 缓存达 6.4 倍,显存占用骤降,可跑更大模型、更长上下文,推理速度几乎不降。

0· 66·0 当前·0 累计

运行时依赖

无特殊依赖

安装命令 点击复制

官方clawhub install turboquant-plus
镜像加速clawhub install turboquant-plus --registry https://cn.clawhub-mirror.com
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务