版本：开发中 🚧

使用 Docker Compose 安装

本指南提供了使用 Docker Compose 部署带有 Envoy AI Gateway 的 vLLM Semantic Router 的分步说明。

通用前提条件

Docker Engine: 更多信息请参阅 Docker Engine 安装

克隆仓库:

git clone https://github.com/vllm-project/semantic-router.git
cd semantic-router

下载分类模型（约 1.5GB，仅首次运行需要）:
```
# 提示：如果遇到错误 'hf: command not found'，请运行 'pip install huggingface_hub hf_transfer'
make download-models
```
这将下载 Router 使用的分类模型：
- Category classifier（ModernBERT-base）
- PII classifier（ModernBERT-base）
- Jailbreak classifier（ModernBERT-base）

要求

Docker Compose v2（docker compose 命令，而不是旧版的 docker-compose）

安装 Docker Compose 插件（如果缺失），更多信息请参阅 Docker Compose 插件安装

# 对于 Debian / Ubuntu
sudo apt-get update
sudo apt-get install -y docker-compose-plugin

# 对于 RHEL / CentOS / Fedora
sudo yum update -y
sudo yum install -y docker-compose-plugin

# 验证
docker compose version

确保端口 8801、50051、19000、3000 和 9090 空闲

启动服务

# 核心（router + envoy）
docker compose -f deploy/docker-compose/docker-compose.yml up --build

# 后台运行（确认无误后推荐）
docker compose -f deploy/docker-compose/docker-compose.yml up -d --build

# 包含 mock vLLM + testing profile（将 Router 指向 mock endpoint）
CONFIG_FILE=/app/config/testing/config.testing.yaml \
  docker compose -f deploy/docker-compose/docker-compose.yml --profile testing up --build

验证

gRPC: localhost:50051
Envoy HTTP: http://localhost:8801
Envoy Admin: http://localhost:19000
Prometheus: http://localhost:9090
Grafana: http://localhost:3000（首次登录使用 admin / admin）

常用操作

# 查看服务状态
docker compose ps

# 跟踪 Router 服务的日志
docker compose logs -f semantic-router

# 进入 Router 容器
docker compose exec semantic-router bash

# 更改配置后重新创建
docker compose -f deploy/docker-compose/docker-compose.yml up -d --build

# 停止并清理容器
docker compose down

通用前提条件​

要求​

启动服务​

验证​

常用操作​

通用前提条件

要求

启动服务

验证

常用操作