基于嵌入的路由 (Embedding Based Routing)
本指南向您展示如何使用嵌入模型的语义相似度来路由请求。基于嵌入的路由根据含义而非精确的关键词将用户查询匹配到预定义类别,使其成为处理多样化措辞和快速演变类别的理想选择。
关键优势
- 可扩展性:无需重新训练模型即可处理无限数量的类别
- 快速:使用高效的嵌入模型(Qwen3, Gemma)实现 10-50ms 的推理
- 灵活:通过更新关键词列表来添加/删除类别,无需重新训练模型
- 语义化:捕捉超出精确关键词匹配的含义
它解决了什么问题?
当用户以不同的方式表达问题时,关键词匹配会失败。基于嵌入的路由解决了:
- 释义处理:"如何安装?" 即使没有完全相同的单词也能匹配 "安装指南"
- 意图检测:根据语义而非表面模式进行路由
- 模糊匹配:处理拼写错误、缩写和非正式语言
- 动态类别:无需重新训练分类模型即可添加新类别
- 多语言支持:嵌入可以捕捉跨语言的语义