Modèle tarifaire

Markup BYOK dégressif. Vos fournisseurs vous facturent directement. 9-12,5 % sur Scale.

Le pricing HiWay est transparent : vos fournisseurs vous facturent directement pour l'inférence à leurs tarifs publiés, et HiWay applique un markup % sur votre dépense API mensuelle. Pas de marge cachée par token, pas d'abonnement fixe - un seul pourcentage qui diminue automatiquement avec le volume.

Plan Free pour démarrer sans carte

Tout nouveau compte accède au plan Free immédiatement, sans carte bancaire. Passez à Scale automatiquement dès que votre volume API le justifie.

Comment fonctionne le BYOK

  1. Vous créez un compte - accès immédiat au plan Free.
  2. Vous branchez vos propres clés API fournisseurs dans Paramètres → Fournisseurs.
  3. HiWay route vos requêtes via votre clé - le fournisseur facture votre carte à son tarif public.
  4. HiWay mesure votre dépense API mensuelle et applique le markup correspondant à votre tranche de volume.

Plans

Plans HiWay2LLM

PlanMarkup HiWayVolume API / moisFeatures
Free-Fonctionnalités basiquesRoutage, stats, 1 clé API
Scale12.5 %< 500 $/moisToutes les features
Scale11 %500 - 5 000 $/moisToutes les features
Scale10 %5 000 - 20 000 $/moisToutes les features
Enterprise9 %20 000 - 50 000 $/moisSLA dédié, contrat annuel
Sur-mesureNégocié> 50 000 $/moisConditions sur mesure

Markup dégressif automatique sur Scale

Le markup est ajusté chaque mois selon votre volume API réel - aucune action requise. Il s'applique sur votre facture API brute (pré-routing). L'auto-reload recharge votre wallet HiWay automatiquement quand le solde passe sous un seuil configurable.

Comment est calculé le markup ?

Le markup s'applique sur votre dépense API mensuelle - ce que vos fournisseurs vous ont facturé ce mois-ci. Vous bénéficiez en prime des économies de routing (downgrade automatique vers des modèles moins chers) qui réduisent votre facture provider - et donc votre base de markup.

Inclus dans tous les plans

  • Routage intelligent sur vos fournisseurs activés
  • Guardian - règles anti-boucle par workspace
  • Fallback fournisseur sur erreurs upstream (max 2 retries)
  • Budget Control pour plafonner votre dépense BYOK upstream
  • Cache sémantique vector store
  • A/B Experiments - benchmark de modèles sur trafic réel
  • Masquage PII opt-in
  • CORTEX - IA de bord (triage, insights workspace, conseiller stratégique)
  • CLI, SDK Python et TypeScript open source
  • Dashboard, logs d'usage, économies vs baseline Opus 4.7

Enterprise : SLA dédié + markup négocié

Au-delà de $20K/mois de dépense API : frais négociés, contrat annuel, SLA dédié. Contactez [email protected].

Wallet à zéro ? Le service continue

Si votre wallet HiWay atteint 0, les requêtes basculent automatiquement en mode passthrough, BYOK direct, markup = 0%, smart routing suspendu. Vous avez 72 heures OU 100 000 tokens de période de grâce pour recharger, avec un email d'avertissement à 50%. Au-delà du cap, les nouvelles requêtes renvoient HTTP 402 jusqu'au prochain rechargement. Voir la page concept Mode passthrough pour le détail.