安装
本指南将帮助您安装和运行 vLLM Semantic Router。Router 完全在 CPU 上运行,推理不需要 GPU。
系统要求
注意
无需 GPU - Router 使用优化的 BERT 模型在 CPU 上高效运行。
要求:
- Python: 3.10 或更高版本
- 容器运行时: Docker 或 Podman(运行 Router 容器所需)
快速开始
1. 安装 vLLM Semantic Router
# 创建虚拟环境(推荐)
python -m venv vsr
source vsr/bin/activate # Windows 上: vsr\Scripts\activate
# 从 PyPI 安装
pip install vllm-sr
验证安装:
vllm-sr --version
2. 初始化配置
# 在当前目录创建 config.yaml
vllm-sr init
这将创建一个带有默认设置的 config.yaml 文件。