Apprenez comment fonctionne le routage intelligent, intégrez n'importe quel client chat-completions en 2 minutes, et maîtrisez les Contrôles budgétaires, la recharge auto et le système Guardian.
Commencer par le démarrage rapideDe l'inscription à votre première requête routée en moins de 2 minutes.
Python, TypeScript et un CLI en une ligne. Licence MIT. Utilisez HiWay sans toucher au dashboard.
OpenAI, Anthropic, LangChain, Vercel AI SDK, n8n - changez une ligne.
Comment signer vos requêtes avec votre clé hw_live_.
Décision sub-milliseconde, déterministe, aucun appel LLM.
Markup BYOK dégressif. Vos fournisseurs vous facturent directement. 9-12,5 % sur Scale.
Règles par workspace pour bloquer les agents runaway, le trafic dupliqué et les pics de coût.
Plafonnez votre coût BYOK upstream mensuel. Verdict : BLOCK, DOWNGRADE ou LIGHT_ONLY.
Quand un fournisseur tombe, HiWay retry sur le modèle le moins cher du même tier. Max 2 retries.
Skip total des requêtes identiques et quasi-identiques - zéro token, réponse instantanée.
On ajoute les breakpoints `cache_control` à vos requêtes Anthropic automatiquement. Input ~10x moins cher sur les cache hits, zéro config.
Opt-in. Regex sur email / téléphone / carte / IBAN / clés API avant hashing du cache.
Wallet à 0 ? Le service continue en BYOK direct pendant 72h / 100k tokens, puis arrêt soft jusqu'au rechargement.
Lancez N variantes d'une requête en parallèle sur plusieurs modèles. Comparez coût, latence, qualité.
Body OpenAI-compatible + métadonnées _hiway + headers X-HiWay-Routed-*.
Comment HiWay forwarde les Server-Sent Events de bout en bout.
HiWay est transparent au tool-calling sur tous les fournisseurs supportés.
Pourquoi le system prompt influence le tier vers lequel votre requête est routée.
Seuils par workspace, webhooks d'alerte, on/off par règle.
Plafond mensuel USD sur le coût BYOK upstream.
Cache vector store - disponible sur tous les packs.
Masquage regex avant cache, embedding et (optionnellement) appel fournisseur.
Benchmark de modèles sur le trafic réel sans glue code.
7 couches IA : surveillance, mix optimal de modèles, souveraineté et chatbot sur vos propres données.
Sécurité des prompts en deux couches : injection, jailbreak, fuite de données et secrets, en moins de 2 ms, toujours actif.
Modes par workspace et par clé, seuils personnalisés, règles IP et webhooks SIEM.
Description détaillée de chaque type de menace, exemples de payloads et conseils de tuning.
Comment le Security Shield supporte le RGPD, SOC 2 et les exigences d'audit enterprise.
Skip le routing CORTEX pour les requêtes à modèle explicite. Forward direct au provider. Markup standard maintenu.
Générez votre première image, audio ou embedding en moins de 5 minutes.
T1 / T2 / T3 - compromis coût vs qualité, par modalité.
fal.ai Flux, OpenAI DALL-E 3, Stability AI SD3 - via vos propres clés.
Jobs asynchrones, preview gate, fal.ai + Runway - jusqu'à 10 secondes.
Text-to-speech avec cache 7 jours. Transcription jusqu'à 250 Mo.
Embeddings BYOK avec cache Redis 30 jours. OpenAI, Cohere, Voyage AI.
200+ modèles en LLM, image, vidéo, audio et embeddings - tous en BYOK. Guides clé API pour les 12 providers supportés.
Claude Opus 4.7, Sonnet 4.6, Haiku 4.5 - guide de setup.
Flux, Wan 2.1, Kling, LTX-Video - images et vidéo async via BYOK.
Drop-in : changez une ligne, routez via HiWay.
Le chemin TypeScript/JavaScript vers HiWay.
Pointez LangChain sur HiWay avec un seul changement de base_url.
UIs de chat streamées avec HiWay comme provider.
Utilisez HiWay comme endpoint LLM pour chaque node AI n8n.
Pas de SDK ? Pas de problème. HiWay parle chat-completions standard.
Change deux lignes, garde tout le reste de ton intégration.
Alternative managée à ton router self-hosted - quand le coût ops ne vaut plus la peine.
Reste sur Vercel si tu veux. Remplace juste l'upstream : le gateway Vercel par HiWay.
BYOK + smart routing, sans les guardrails ni la prompt library de Portkey.
Garde ton compte provider, ajoute un router - sélection intelligente des modèles sans réécrire une ligne de logique.
L'endpoint de routage principal.
Quota du workspace courant, plan et économies cumulées.
Liste les modèles disponibles via vos fournisseurs activés.
Tous les statuts HTTP que HiWay retourne et ce qu'ils signifient.
Souscrivez aux événements budget, Guardian, paiement, rotation de clé, et compte. Payloads signés avec retry.
Quand HiWay refuse une requête parce qu'un plafond a été touché.
Votre clé API n'a pas authentifié. Voici comment réparer.
Qui vous a rate-limité, et comment débloquer.
Quand toutes les tentatives fallback ont échoué.
Les questions qu'on reçoit le plus, répondues en un seul endroit.
Termes spécifiques à HiWay, expliqués.
Ce qui a été livré, et quand.