Enveloppe de réponse
Body OpenAI-compatible + métadonnées _hiway + headers X-HiWay-Routed-*.
HiWay renvoie un body chat-completions OpenAI-compatible, enrichi d'un objet de métadonnées _hiway et de deux headers de réponse custom. Votre client OpenAI-SDK existant lit le body sans souci ; les métadonnées sont additives et ne cassent jamais le parsing standard.
Exemple de body
json
{
"id": "chatcmpl-...",
"object": "chat.completion",
"model": "anthropic/claude-haiku-4-5",
"choices": [ { "message": { ... } } ],
"usage": { "prompt_tokens": 42, "completion_tokens": 18, "total_tokens": 60 },
"_hiway": {
"routed_model": "anthropic/claude-haiku-4-5",
"routed_tier": "light",
"score": 0.18,
"reason": "prompt court, pas d'outils, temp=0",
"fallback": false,
"cache_hit": false,
"upstream_cost": 0.0004,
"baseline_cost": 0.0065,
"savings": 0.0061
}
}Headers
| Header | Signification |
|---|---|
X-HiWay-Routed-Model | Id qualifié complet du modèle qui a réellement répondu (ex. anthropic/claude-haiku-4-5) |
X-HiWay-Routed-Tier | Tier de routage choisi : light, standard, heavy, cache, override |
Baseline = modèle flagship
baseline_cost est ce que la même requête aurait coûté contre le flagship actuel (Claude Opus 4.7 à l'heure où ces lignes sont écrites). savings = baseline_cost - upstream_cost. Sommé sur votre workspace, ça alimente le chiffre d'économies dans Tableau de bord → Usage.