Version: 🚧 Next

RouterDC Selection

RouterDC uses semantic embeddings to match user queries with the most suitable model. It computes similarity between query embeddings and model representations to select the best match.

Reference: RouterDC: Query-Based Router by Dual Contrastive Learning (Guo et al., NeurIPS 2024) achieves +2.76% in-distribution and +1.90% out-of-distribution accuracy improvements.

The paper trains a query encoder using dual contrastive losses (Sample-LLM loss + Sample-Sample loss) with jointly learned LLM embeddings. Our implementation provides a simplified approach using pre-computed embeddings of model descriptions rather than jointly trained LLM-specific embeddings.

Algorithm Flow

Mathematical Foundation

Cosine Similarity

RouterDC uses cosine similarity to compare query and model embeddings:

sim(q, m) = (q · m) / (||q|| × ||m||)
          = Σ(q_i × m_i) / (√Σq_i² × √Σm_i²)

Where:

q = Query embedding vector (e.g., 768 dimensions)
m = Model description embedding vector
Result is in range [-1, 1], higher = more similar

Contrastive Learning

The embedding space is trained using dual contrastive losses:

Sample-LLM Loss: Pulls query embeddings toward well-performing models and away from poor-performing ones
Sample-Sample Loss: Groups similar queries together to ensure consistent routing

Core Algorithm (Go)

// Select using embedding similarity
func (s *RouterDCSelector) Select(ctx context.Context, selCtx *SelectionContext) (*SelectionResult, error) {
    queryEmbedding, err := s.embedFunc(selCtx.Query)
    if err != nil {
        return nil, err
    }
    
    var bestModel string
    var bestSim float64 = -1
    
    for _, candidate := range selCtx.CandidateModels {
        modelEmbedding := s.modelEmbeddings[candidate.Model]
        sim := cosineSimilarity(queryEmbedding, modelEmbedding)
        
        if sim > bestSim {
            bestSim = sim
            bestModel = candidate.Model
        }
    }
    
    if bestSim < s.config.SimilarityThreshold {
        return s.fallbackToDefault(selCtx)
    }
    
    return &SelectionResult{
        SelectedModel: bestModel,
        Score:         bestSim,
        Method:        MethodRouterDC,
    }, nil
}

How It Works

Each model has a description and optional capabilities list
Incoming queries are embedded into a vector representation
Query embeddings are compared against model description embeddings
The model with highest similarity score is selected

Configuration

decision:
  algorithm:
    type: router_dc
    router_dc:
      require_descriptions: true   # Fail if models lack descriptions
      use_capabilities: true       # Include capabilities in matching
      similarity_threshold: 0.3    # Minimum similarity to consider

models:
  - name: gpt-4
    backend: openai
    description: "Advanced reasoning, complex analysis, mathematical proofs, and detailed explanations"
    capabilities:
      - reasoning
      - mathematics
      - code-review
      - analysis

  - name: gpt-3.5-turbo
    backend: openai
    description: "Fast responses for simple questions, casual conversation, and quick tasks"
    capabilities:
      - general
      - chat
      - summarization

  - name: code-llama
    backend: local
    description: "Code generation, debugging, refactoring, and programming assistance"
    capabilities:
      - code-generation
      - debugging
      - refactoring

Writing Effective Descriptions

Good descriptions are specific and differentiate models:

Good:

description: "Mathematical reasoning, theorem proving, step-by-step problem solving"

Bad:

description: "A good AI model"  # Too vague

Description Tips

Be specific: Mention concrete tasks the model excels at
Use keywords: Include terms users might use in queries
Differentiate: Highlight what makes this model unique
Keep concise: 1-2 sentences, focused on strengths

Capabilities List

Capabilities provide structured metadata for matching:

capabilities:
  - code-generation    # Primary strength
  - python             # Language specialization
  - debugging          # Related task

When use_capabilities: true, capabilities are combined with the description for richer matching.

Validation

Enable strict validation to catch configuration issues:

router_dc:
  require_descriptions: true

With this enabled, the router will fail to start if any model lacks a description.

Best Practices

Invest in descriptions: Quality descriptions dramatically improve routing
Test with real queries: Verify routing matches expectations
Update descriptions: Refine based on observed misroutes
Use capabilities sparingly: 3-5 focused capabilities per model
Enable require_descriptions: Catch missing descriptions at startup

Algorithm Flow​

Mathematical Foundation​

Cosine Similarity​

Contrastive Learning​

Core Algorithm (Go)​

How It Works​

Configuration​

Writing Effective Descriptions​

Description Tips​

Capabilities List​

Validation​

Best Practices​