多轮对话 (Multi Turn Conversations)
路由记忆 (Router Memory) 通过 OpenAI Response API 实现有状态对话,支持使用 previous_response_id 进行对话链式调用。
概览
Semantic Router 充当仅支持 Chat Completions API 的多个 LLM 后端的统一大脑。它提供:
- 跨模型有状态对话:跨不同模型维护对话历史
- 统一的 Response API:无论后端模型如何,均使用单一的 API 接口
- 透明转换:Response API 与 Chat Completions 之间的自动转换
通过路由记忆,您可以从一个模型开始对话并使用另一个模型继续对话——对话历史保存在路由中,而不是保存在任何单个后端中。
请求流程
端点 (Endpoints)
| 端点 | 方法 | 描述 |
|---|---|---|
/v1/responses | POST | 创建新响应 |
/v1/responses/{id} | GET | 获取已存储的响应 |
/v1/responses/{id} | DELETE | 删除已存储的响应 |
/v1/responses/{id}/input_items | GET |