2026
- 1月5日 - vLLM Semantic Router v0.1 Iris: The First Major Release
- 1月23日 - Building Mixture-of-Models on AMD GPUs with vLLM-SR
- 3月10日 - vLLM Semantic Router v0.2 Athena: ClawOS, Model Refresh, and the System Brain
- 3月12日 - v0.3 Themis Roadmap: Stability at Scale
- 3月25日 - Deploying vLLM Semantic Router on AMD Developer Cloud
2025
- 9月6日 - vLLM Semantic Router: Next Phase in LLM inference
- 10月20日 - Semantic Router Q4 2025 Roadmap: Journey to Iris
- 10月25日 - From Monolithic to Modular: Scaling Semantic Routing with Extensible LoRA
- 11月7日 - Semantic Tool Selection: Building Smarter AI Agents with Context-Aware Routing
- 11月19日 - Signal-Decision Driven Architecture: Reshaping Semantic Routing at Scale
- 12月14日 - Token-Level Truth: Real-Time Hallucination Detection for Production LLMs
- 12月16日 - AMD × vLLM Semantic Router: Building the System Intelligence Together