Milvus 语义缓存 (Milvus Semantic Cache)
Milvus 缓存后端使用 Milvus 向量数据库提供持久化、分布式的语义缓存。这是需要高可用性、可扩展性和数据持久性的生产环境部署的推荐方案。
概览
Milvus 缓存非常适合:
- 具有高可用性要求的生产环境
- 跨多个实例的分布式部署
- 具有数百万个缓存查询的大规模应用
- 缓存需在重启后保留的持久化存储要求
- 先进的向量操作和相似度搜索优化
架构
配置
Milvus 后端配置
在 config/semantic-cache/milvus.yaml 中配置:
# config/semantic-cache/milvus.yaml
connection:
host: "localhost"
port: 19530
auth:
enabled: false
username: ""
password: ""
tls:
enabled: false
collection:
name: "semantic_cache"
dimension: 384 # 必须与嵌入模型的维度匹配
index_type: "IVF_FLAT"
metric_type: "COSINE"
nlist: 1024
performance:
search_params:
nprobe: 10
insert_batch_size: 1000
search_batch_size: 100
development:
drop_collection_on_startup: false
auto_create_collection: true
log_level: "info"