HiWay2LLM analyse chaque requête en <1ms et la route vers le modèle optimal à travers vos propres clés API. Les messages simples vont vers les modèles économiques. Les tâches complexes vers les plus puissants. Vous économisez 40-60 % sur un mix typique, sans aucune marge.
<1ms
Latence de routage
9%
Markup minimum (Enterprise)
0
Prompts stockés
200+
Modèles - LLM, image, vidéo, audio et embeddings
Comment ça s'emboîte
HiWay2LLM s'intercale entre ton code et les fournisseurs LLM. Tes clés. Tes données. Notre intelligence de routage.
200+ models · LLM · Image · Video · Audio · Embeddings - all via BYOK
De l'inscription à votre première requête routée en moins de 2 minutes.
Compte créé en 30 secondes. Email + mot de passe, l'offre gratuite est active immédiatement - 2M tokens/mois, sans carte bancaire.
Branchez vos propres clés pour n'importe quel provider supporté - LLM (Anthropic, OpenAI, Google, Mistral, Groq…), image (Flux, Stability AI, fal.ai), vidéo (Kling, Runway), audio (ElevenLabs) ou embeddings (Cohere, Voyage AI). Elles restent chiffrées chez nous et vous êtes facturé directement par vos fournisseurs. Aucune marge sur l'inférence.
Pointez le base_url de votre SDK vers HiWay2LLM. Un seul endpoint atteint tous les modèles que vous avez activés, et le routeur choisit le modèle le moins cher capable de traiter chaque requête. Compatible OpenAI. Fonctionne avec n'importe quel SDK.
Pointez votre code existant vers HiWay2LLM. On s'occupe du reste.
Haiku 4.5 / GPT-4o-mini / Gemini 2.5 Flash Lite
65% des requêtes
Sonnet 4.6 / GPT-4o / Gemini 2.5 Flash
28% des requêtes
Opus 4.7 / GPT-5 / Gemini 2.5 Pro
7% des requêtes
7 analyseurs, alerting burn-rate, optimisation multi-fournisseur - et CORTEX, l'IA qui auto-calibre votre routeur pendant que vous shippez.
7 analyseurs détectent l'intention, la complexité, les outils et le code en moins d'une milliseconde. Pas d'appel LLM pour le routage - pur CPU.
Baseline par agent, détection de l'inflation de prompts, des escalades silencieuses vers des modèles premium et des dérives tarifaires. Alertes, rollback, budgets par agent. Conçu pour les CTO qui veulent la maîtrise totale de leur dépense LLM.
On surveille votre dépense en temps réel. Seuils de burn-rate, détection d'anomalies et alertes par clé : on déclenche dès que quelque chose dérive - avant que votre facture le fasse.
Aucun fournisseur LLM ne propose ça. Plafonds journaliers/mensuels, limites par modèle, règles hors-heures, et dégradation automatique.
Exports CSV par utilisateur, ventilation quotidienne par modèle, attribution des coûts au token près. Branchez-le sur votre facturation en deux clics.
Apportez vos propres clés de n'importe quel provider - LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate…), image (Flux, Stability AI, fal.ai), vidéo (Kling, Runway, Luma), audio (ElevenLabs, HeyGen) et embeddings (Cohere, Voyage AI). Une seule API, toutes les modalités.
Changez votre base_url. C'est tout. Compatible avec tous les SDK LLM - OpenAI, Anthropic, LangChain, Vercel AI, n8n.
Vos prompts ne touchent jamais notre disque. Garantie architecturale. Conforme RGPD et AI Act européen.
IA proactive qui lit les événements Guardian, auto-calibre les seuils de routage et pousse des insights dans votre CORTEX Inbox - pour voir les problèmes avant vos utilisateurs. Scale et Enterprise.
Scanner deux couches : injection, jailbreak, fuite PII et secrets en moins de 2 ms, avant d'atteindre le modèle. Zéro latence en mode monitor.
Injection de prompt
Bloque "ignorez toutes les instructions précédentes", mode DAN, mode développeur et les patterns de substitution de persona.
Extraction de prompt
Détecte les tentatives de lecture de votre prompt système ou de vos instructions internes.
Jailbreak
Stoppe les demandes de malware, exploits, synthèse de substances contrôlées et contenus illégaux.
Détection PII
Signale emails, numéros de téléphone, IBANs et identifiants fiscaux avant qu'ils n'atteignent le modèle, conforme RGPD.
Fuite de secrets
Détecte les clés API (OpenAI, Anthropic, GitHub PAT, tokens Bearer) collées accidentellement dans les prompts.
CLI en 30 secondes, SDK Python et TypeScript compatibles OpenAI. Aucun vendor-lock : tu peux sortir d'HiWay sans toucher une ligne de code applicatif.
Install en une ligne, signup direct, premier appel depuis le terminal. Parfait pour tester avant de coder quoi que ce soit.
npm i -g @hiway2llm/cli hw signup hw chat "explain this in 3 bullets"
Import drop-in. Toutes les méthodes qui existent dans l'OpenAI SDK fonctionnent - on ne fait que rediriger vers le bon modèle.
pip install hiway2llm
from hiway2llm import Hiway
cli = Hiway(api_key="hw_live_...")
cli.chat("Say hi")Client fetch natif, compatible Node et Edge runtimes (Vercel, Cloudflare Workers).
npm i @hiway2llm/client
import { Hiway } from "@hiway2llm/client";
const h = new Hiway({ apiKey: "hw_live_..." });
await h.chat("Say hi");Gardez votre clé Anthropic, payez Anthropic directement. HiWay mesure la conso et facture un markup % sur le coût réel routé - largement rentabilisé par les économies de routage.
Commencez gratuitement. Passez à l'échelle quand vous êtes prêt.
Sans carte bancaire · Résiliation immédiate · Accès instantané
Routage intelligent − frais HiWay2LLM = gain net
Profil d'usage
Mix estimé : 40% Haiku · 50% Sonnet · 10% Opus
Économie nette / mois
+$501
soit +50% sur ta facture actuelle
Simulation indicative · basée sur le mix modèles typique de votre profil
Free
Pour tester et prototyper.
Scale
jusqu'à
−60%sur tes coûts IA réels · CORTEX route vers le modèle optimal
Dégressif : <$500 → 12,5% · $500-5K → 11% · $5K-20K → 10%
Enterprise
$20K-50K/mois → 9% · au-delà : sur-mesure négocié
Toutes les fonctionnalités core sont disponibles dès le premier pack. Les features avancées s'ouvrent avec Scale et Enterprise.
| Fonctionnalité | FreeRoutage de base · 10M/mois | ScaleMarkup 12,5 → 10% | EnterpriseSur devis |
|---|---|---|---|
| USAGE & QUOTAS | |||
| Tokens inclus | par pack acheté | 1B / achat | custom |
| Auto-reload | |||
| Sièges équipe | 3 | 25 | ∞ |
| Workspaces | 1 | 5 | ∞ |
| Conservation analytics | 30j | 1 an | ∞ |
| MOTEUR DE ROUTAGE | |||
| Smart routing (model=auto) | |||
| BYOK fournisseurs | |||
| 0 % marge sur l'inférence | |||
| Fallback automatique | |||
| Guardian anti-loop | |||
| CORTEX alertes Inbox | |||
| CONTRÔLES AVANCÉS | |||
| Cache sémantique | |||
| A/B testing modèles | |||
| Journal d'audit | |||
| CORTEX complet (5 phases) | |||
| SSO (Google, Microsoft) | |||
| Masquage PII | |||
| Self-hosted | |||
| Règles routage custom | |||
| SUPPORT & CONFORMITÉ | |||
| Canal de support | Priority | SLA 99.99% | |
| DPA (RGPD) | |||
| Financement disponible | |||
| Ingénieur dédié | |||
L'inférence est toujours facturée directement par vos fournisseurs LLM, sur vos propres clés. Les prix ci-dessus n'incluent pas l'inférence.
INCLUS DANS CHAQUE PLAN
BYOK - apportez vos propres clés de n'importe quel provider supporté : LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate, Cohere…), image (Flux/BFL, Stability AI, fal.ai), vidéo (Kling, Runway, Luma AI), audio (ElevenLabs, HeyGen). L'inférence est facturée directement par vos fournisseurs. HiWay facture uniquement un markup % sur le coût routé réel.
Vos utilisateurs envoient des messages simples 70% du temps. Pourquoi payer le prix d'Opus pour un bonjour ?
Commencer gratuitementComparatif honnête. Mis à jour le 2026-04-22 d'après les docs publiques de chaque éditeur.
| Fonctionnalité | HiWay2LLM | OpenRouter | Portkey | LiteLLM | Requesty |
|---|---|---|---|---|---|
| Tes propres clés (BYOK) | |||||
| Routing intelligent par complexité de requête | |||||
| API compatible OpenAI | |||||
| Fallback automatique entre providers | |||||
| Prompt caching (Anthropic / OpenAI) | |||||
| Analytics par workspace + audit log | |||||
| Alertes burn-rate (pics de budget) | |||||
| Hébergement UE par défaut (RGPD) | self-host | ||||
| Aucun log de prompt | |||||
| Auto-gestion IA (CORTEX) | |||||
| Modèle de pricing | forfait €/mois | % markup | forfait + % markup | self-host / SaaS | % markup |
natif · partiel / plugin · non proposé. On vérifie chaque claim contre les docs publiques de l'éditeur - si tu repères une erreur, dis-le-nous.