Enveloppe de réponse

Body OpenAI-compatible + métadonnées _hiway + headers X-HiWay-Routed-*.

HiWay renvoie un body chat-completions OpenAI-compatible, enrichi d'un objet de métadonnées _hiway et de deux headers de réponse custom. Votre client OpenAI-SDK existant lit le body sans souci ; les métadonnées sont additives et ne cassent jamais le parsing standard.

Exemple de body

json
{
  "id":      "chatcmpl-...",
  "object":  "chat.completion",
  "model":   "anthropic/claude-haiku-4-5",
  "choices": [ { "message": { ... } } ],
  "usage":   { "prompt_tokens": 42, "completion_tokens": 18, "total_tokens": 60 },
  "_hiway": {
    "routed_model":    "anthropic/claude-haiku-4-5",
    "routed_tier":     "light",
    "score":           0.18,
    "reason":          "prompt court, pas d'outils, temp=0",
    "fallback":        false,
    "cache_hit":       false,
    "upstream_cost":   0.0004,
    "baseline_cost":   0.0065,
    "savings":         0.0061
  }
}

Headers

HeaderSignification
X-HiWay-Routed-ModelId qualifié complet du modèle qui a réellement répondu (ex. anthropic/claude-haiku-4-5)
X-HiWay-Routed-TierTier de routage choisi : light, standard, heavy, cache, override

Baseline = modèle flagship

baseline_cost est ce que la même requête aurait coûté contre le flagship actuel (Claude Opus 4.7 à l'heure où ces lignes sont écrites). savings = baseline_cost - upstream_cost. Sommé sur votre workspace, ça alimente le chiffre d'économies dans Tableau de bord → Usage.