Glossaire
Termes spécifiques à HiWay, expliqués.
Routage
Tier - un de light, standard, heavy. Chaque tier mappe à un ensemble de modèles fournisseurs de prix/qualité similaires.
Profil de routage - budget, balanced, ou quality. Décale la stratégie de sélection dans un tier : budget prend le prix d'entrée le moins cher, quality prend le score de qualité le plus haut.
Scoring - le moteur déterministe qui évalue la complexité de chaque requête pour choisir un tier (CPU, sans second LLM).
Pinning - bypasser le router en mettant model à un id de modèle qualifié complet. Utile pour le testing A/B ou quand vous voulez une sélection déterministe.
Fallback - retry automatique sur le modèle suivant le moins cher du même tier quand un appel upstream échoue. Max 2 retries.
Facturation
BYOK - Bring Your Own Key. Vous branchez vos propres clés fournisseurs dans HiWay ; les fournisseurs vous facturent directement aux tarifs publiés. HiWay ne fait pas office de revendeur.
Markup - le pourcentage que HiWay prélève sur votre dépense API mensuelle. Sur Scale : 12,5 % (< $500/mois), 11 % ($500-$5K), 10 % ($5K-$20K). Enterprise : 9 % ($20K-$50K), sur-mesure négocié au-delà de $50K. Dégressif automatiquement selon votre tranche réelle.
Wallet - solde de crédits USD du workspace HiWay. Alimenté par topup Stripe. Les débits correspondent au markup de votre consommation API mensuelle. Alertes configurables (20 %, 10 %, 0 %).
Auto-reload - recharge automatique du wallet HiWay (crédits USD) quand le solde passe sous un seuil configurable. S'active dans Tableau de bord → Facturation.
Baseline d'économies - le modèle phare utilisé pour calculer le chiffre d'économies. Actuellement Claude Opus 4.7. Mis à jour quand les gammes phares des fournisseurs évoluent.
Sécurité
Guardian - le système de sécurité anti-boucle / anti-pic. Cinq règles : dedup, pic de coût, context bloat, agent zombie, rate limit.
Budget Control - plafond mensuel sur le coût BYOK upstream. Trois verdicts : DOWNGRADE (90%), LIGHT_ONLY (95%), BLOCK (100%).
Masquage PII - masquage regex d'email / téléphone / carte / IBAN / clés API avant la mise en cache, et optionnellement avant l'appel fournisseur.
Performance
Cache sémantique - rejoue la réponse stockée quand une nouvelle requête est quasi-identique à une précédente. Inclus sur Scale et Enterprise.
A/B Experiment - benchmarking parallèle de 2-5 modèles candidats sur un échantillon de votre trafic. Inclus sur Scale et Enterprise.