Go to file
Bifang 18fe5908a1 first commit 2026-06-05 15:53:47 +08:00
.dockerignore first commit 2026-06-05 15:53:47 +08:00
.env first commit 2026-06-05 15:53:47 +08:00
Dockerfile first commit 2026-06-05 15:53:47 +08:00
README.md first commit 2026-06-05 15:53:23 +08:00
compose.yaml first commit 2026-06-05 15:53:47 +08:00
model_download.py first commit 2026-06-05 15:53:47 +08:00
serve.py first commit 2026-06-05 15:53:47 +08:00

README.md

vLLM Docker

Start

启动容器,并根据 Dockerfile 构建镜像。

docker compose up -d --build

Logs

查看实时日志。第一次启动如果在下载模型,这里能看到进度。

docker compose logs -f

Status

查看容器当前是否已经正常启动。

docker compose ps

Test API

测试模型服务是否已经可用。返回 Unauthorized 也说明服务已经启动,只是需要带 API Key。

curl http://127.0.0.1:9527/v1/models

带 API Key 测试模型列表:

curl http://127.0.0.1:9527/v1/models \
  -H "Authorization: Bearer unis123"

测试聊天接口:

curl http://127.0.0.1:9527/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer unis123" \
  -d '{
    "model": "Qwen3-9B",
    "messages": [
      {"role": "user", "content": "你好,做个自我介绍"}
    ]
  }'

Stop

停止并删除当前 compose 创建的容器。

docker compose down

Rebuild With Latest Base Image

先拉最新基础镜像,再重新构建并启动。基础镜像更新后用这个。

docker compose build --pull
docker compose up -d

Export Image

把当前构建好的镜像导出成 tar 包,方便拷到别的机器。

docker save -o vllm-qwen3-9b-latest.tar local/vllm-qwen3-9b:latest