Glossaire

Termes spécifiques à HiWay, expliqués.

Routage

Tier - un de light, standard, heavy. Chaque tier mappe à un ensemble de modèles fournisseurs de prix/qualité similaires.

Profil de routage - budget, balanced, ou quality. Décale la stratégie de sélection dans un tier : budget prend le prix d'entrée le moins cher, quality prend le score de qualité le plus haut.

Scoring - le moteur déterministe qui évalue la complexité de chaque requête pour choisir un tier (CPU, sans second LLM).

Pinning - bypasser le router en mettant model à un id de modèle qualifié complet. Utile pour le testing A/B ou quand vous voulez une sélection déterministe.

Fallback - retry automatique sur le modèle suivant le moins cher du même tier quand un appel upstream échoue. Max 2 retries.

Facturation

BYOK - Bring Your Own Key. Vous branchez vos propres clés fournisseurs dans HiWay ; les fournisseurs vous facturent directement aux tarifs publiés. HiWay ne fait pas office de revendeur.

Markup - le pourcentage que HiWay prélève sur votre dépense API mensuelle. Sur Scale : 12,5 % (< $500/mois), 11 % ($500-$5K), 10 % ($5K-$20K). Enterprise : 9 % ($20K-$50K), sur-mesure négocié au-delà de $50K. Dégressif automatiquement selon votre tranche réelle.

Wallet - solde de crédits USD du workspace HiWay. Alimenté par topup Stripe. Les débits correspondent au markup de votre consommation API mensuelle. Alertes configurables (20 %, 10 %, 0 %).

Auto-reload - recharge automatique du wallet HiWay (crédits USD) quand le solde passe sous un seuil configurable. S'active dans Tableau de bord → Facturation.

Baseline d'économies - le modèle phare utilisé pour calculer le chiffre d'économies. Actuellement Claude Opus 4.7. Mis à jour quand les gammes phares des fournisseurs évoluent.

Sécurité

Guardian - le système de sécurité anti-boucle / anti-pic. Cinq règles : dedup, pic de coût, context bloat, agent zombie, rate limit.

Budget Control - plafond mensuel sur le coût BYOK upstream. Trois verdicts : DOWNGRADE (90%), LIGHT_ONLY (95%), BLOCK (100%).

Masquage PII - masquage regex d'email / téléphone / carte / IBAN / clés API avant la mise en cache, et optionnellement avant l'appel fournisseur.

Performance

Cache sémantique - rejoue la réponse stockée quand une nouvelle requête est quasi-identique à une précédente. Inclus sur Scale et Enterprise.

A/B Experiment - benchmarking parallèle de 2-5 modèles candidats sur un échantillon de votre trafic. Inclus sur Scale et Enterprise.