API 参考
软件包
vllm.ai/v1alpha1
软件包 v1alpha1 包含了 v1alpha1 API 组的 API Schema 定义。
资源类型
Decision (决策)
Decision 定义了基于规则组合的路由决策。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此决策的唯一标识符 | MaxLength: 100 MinLength: 1 Required: {} | |
priority integer | Priority 定义了此决策的优先级(值越高 = 优先级越高) 当策略为 "priority" 时使用 | 0 | Maximum: 1000 Minimum: 0 |
description string | Description 提供了对此决策的人类可读描述 | MaxLength: 500 | |
signals SignalCombination | Signals 定义了信号组合逻辑 | Required: {} | |
modelRefs ModelRef array | ModelRefs 定义了此决策的模型引用(目前仅支持一个模型) | MaxItems: 1 MinItems: 1 Required: {} | |
plugins DecisionPlugin array | Plugins 定义了应用于此决策的插件 | MaxItems: 10 |
DecisionPlugin (决策插件)
DecisionPlugin 定义了决策的插件配置。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
type string | Type 是插件类型 (semantic-cache, jailbreak, pii, system_prompt, header_mutation) | Enum: [semantic-cache jailbreak pii system_prompt header_mutation] Required: {} | |
configuration RawExtension | Configuration 是作为原始 JSON 对象的插件特定配置 | Schemaless: {} |
DomainSignal (领域信号)
DomainSignal 定义了用于分类的领域类别。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此领域的唯一标识符 | MaxLength: 100 MinLength: 1 Required: {} | |
description string | Description 提供了对此领域的人类可读描述 | MaxLength: 500 |
EmbeddingSignal (嵌入信号)
EmbeddingSignal 定义了基于嵌入的信号提取规则。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此信号的唯一标识符 | MaxLength: 100 MinLength: 1 Required: {} | |
threshold float | Threshold 是匹配的相似度阈值 (0.0-1.0) | Maximum: 1 Minimum: 0 Required: {} | |
candidates string array | Candidates 是用于语义匹配的候选短语列表 | MaxItems: 100 MinItems: 1 Required: {} | |
aggregationMethod string | AggregationMethod 定义了如何聚合多个候选相似度 | max | Enum: [mean max any] |
IntelligentPool (智能池)
IntelligentPool 定义了带有配置的模型池。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
apiVersion string | vllm.ai/v1alpha1 | ||
kind string | IntelligentPool | ||
metadata ObjectMeta | 有关 metadata 的字段,请参阅 Kubernetes API 文档。 | ||
spec IntelligentPoolSpec | |||
status IntelligentPoolStatus |
IntelligentPoolList (智能池列表)
IntelligentPoolList 包含 IntelligentPool 列表。
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
apiVersion string | vllm.ai/v1alpha1 | ||
kind string | IntelligentPoolList | ||
metadata ListMeta | 有关 metadata 的字段,请参阅 Kubernetes API 文档。 | ||
items IntelligentPool array |
IntelligentPoolSpec (智能池规范)
IntelligentPoolSpec 定义了 IntelligentPool 的期望状态。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
defaultModel string | DefaultModel 指定未选择特定模型时使用的默认模型 | MaxLength: 100 MinLength: 1 Required: {} | |
models ModelConfig array | Models 定义了此池中可用模型的列表 | MaxItems: 100 MinItems: 1 Required: {} |
IntelligentPoolStatus (智能池状态)
IntelligentPoolStatus 定义了观察到的 IntelligentPool 状态。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
conditions Condition array | Conditions 代表 IntelligentPool 状态的最新可用观察结果 | ||
observedGeneration integer | ObservedGeneration 反映了最近观察到的 IntelligentPool 的代 (generation) | ||
modelCount integer | ModelCount 表示池中模型的数量 |
IntelligentRoute (智能路由)
IntelligentRoute 定义了智能路由规则和决策。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
apiVersion string | vllm.ai/v1alpha1 | ||
kind string | IntelligentRoute | ||
metadata ObjectMeta | 有关 metadata 的字段,请参阅 Kubernetes API 文档。 | ||
spec IntelligentRouteSpec | |||
status IntelligentRouteStatus |
IntelligentRouteList (智能路由列表)
IntelligentRouteList 包 含 IntelligentRoute 列表。
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
apiVersion string | vllm.ai/v1alpha1 | ||
kind string | IntelligentRouteList | ||
metadata ListMeta | 有关 metadata 的字段,请参阅 Kubernetes API 文档。 | ||
items IntelligentRoute array |
IntelligentRouteSpec (智能路由规范)
IntelligentRouteSpec 定义了 IntelligentRoute 的期望状态。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
signals Signals | Signals 定义了用于路由决策的信号提取规则 | ||
decisions Decision array | Decisions 定义了基于信号组合的路由决策 | MaxItems: 100 MinItems: 1 Required: {} |
IntelligentRouteStatus (智能路由状态)
IntelligentRouteStatus 定义了观察到的 IntelligentRoute 状态。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
conditions Condition array | Conditions 代表 IntelligentRoute 状态的最新可用观察结果 | ||
observedGeneration integer | ObservedGeneration 反映了最近观察到的 IntelligentRoute 的代 (generation) | ||
statistics RouteStatistics | Statistics 提供了有关已配置决策和信号的统计信息 |
KeywordSignal (关键词信号)
KeywordSignal 定义了基于关键词的信号提取规则。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此规则的唯一标识符(也用作类别名称) | MaxLength: 100 MinLength: 1 Required: {} | |
operator string | Operator 定义了关键词的逻辑运算符 (AND/OR) | Enum: [AND OR] Required: {} | |
keywords string array | Keywords 是要匹配的关键词列表 | MaxItems: 100 MinItems: 1 Required: {} | |
caseSensitive boolean | CaseSensitive 指定关键词匹配是否区分大小写 | false |
LoRAConfig (LoRA 配置)
LoRAConfig 定义了 LoRA 适配器配置。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此 LoRA 适配器的唯一标识符 | MaxLength: 100 MinLength: 1 Required: {} | |
description string | Description 提供了对此 LoRA 适配器的人类可读描述 | MaxLength: 500 |
ModelConfig (模型配置)
ModelConfig 定义了单个模型的配置。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
name string | Name 是此模型的唯一标识符 | MaxLength: 100 MinLength: 1 Required: {} | |
reasoningFamily string | ReasoningFamily 指定了推理语法家族(例如 "qwen3", "deepseek") 必须在全局静态配置的 ReasoningFamilies 中定义 | MaxLength: 50 | |
pricing ModelPricing | Pricing 定义了此模型的成本结构 | ||
loras LoRAConfig array | LoRAs 定义了此模型可用的 LoRA 适配器列表 | MaxItems: 50 |
ModelPricing (模型定价)
ModelPricing 定义了模型的定价结构。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
inputTokenPrice float | InputTokenPrice 是每个输入 token 的成本 | Minimum: 0 | |
outputTokenPrice float | OutputTokenPrice 是每个输出 token 的成本 | Minimum: 0 |
ModelRef (模型引用)
ModelRef 定义了不带评分的模型引用。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
model string | Model 是模型名称(必须存在于 IntelligentPool 中) | MaxLength: 100 MinLength: 1 Required: {} | |
loraName string | LoRAName 是要使用的 LoRA 适配器名称(必须存在于模型的 LoRAs 中) | MaxLength: 100 | |
useReasoning boolean | UseReasoning 指定是否为此模型启用推理模式 | false | |
reasoningDescription string | ReasoningDescription 提供了何时使用推理的上下文 | MaxLength: 500 | |
reasoningEffort string | ReasoningEffort 定义了推理努力等级 (low/medium/high) | Enum: [low medium high] |
RouteStatistics (路由统计)
RouteStatistics 提供了有关 IntelligentRoute 配置的统计信息。
出现位置:
| 字段 | 描述 | 默认值 | 验证 |
|---|---|---|---|
decisions integer | Decisions 表示决策数量 | ||
keywords integer | Keywords 表示关键词信号的数量 | ||
embeddings integer | Embeddings 表示嵌入信号的数量 | ||
domains integer | Domains 表示领域信号的数量 |