GPUStack 使用 Docker Compose 自定义 vLLM 镜像升级 Transformers
概述在实际生产环境中,GPUStack 内置的 vLLM 版本可能无法及时适配最新的模型。例如某些新模型需要 transformers 5.5.0 以上版本以及 vllm[audio] 依赖,而官方镜像尚未包含这些依赖。 本文介绍如何通过 Docker Compose + 自定义 Dockerfile 的方式,快速构建适配 vllm/vllm-openai:v0.19.0 的推理镜像并部署。 构建