Comparatif des LLM Gateways - 12 outils sur 10 critères

Il y a trop de LLM gateways pour que la plupart des équipes les évaluent une par une. L'espace s'est rempli vite : chaque cloud, chaque vendor d'observabilité, chaque startup d'outillage IA a shippé une gateway. L'outillage se recouvre. Les différenciateurs sont subtils. Et les pages marketing se ressemblent toutes.

Cette page est une matrice en un coup d'œil : 12 outils qui reviennent dans la plupart des short-lists, comparés sur 10 critères qui différencient vraiment. L'objectif est de faire passer la recherche d'une semaine à un après-midi. Tout ci-dessous est d'après la doc publique de chaque outil au 2026-04-22 - si une cellule te paraît fausse, dis-le nous et on corrige.

Les 12 outils

Le champ est plus large, mais ces douze apparaissent dans presque chaque comparaison qu'on voit en pratique :

Les 10 critères

Ce sont les axes qui comptent dans les vraies discussions d'achat :

  1. Modèle de prix - reseller (marge % sur tokens), abonnement fixe, usage-based sur les requêtes proxifiées, ou gratuit/OSS.
  2. BYOK - tu apportes tes clés providers, ou la gateway les détient ?
  3. Type de smart routing - aucun, fallback-provider (même modèle, autre upstream), ou niveau-modèle (choisit un modèle différent selon la difficulté de la requête).
  4. Hébergement EU - existe-t-il un vrai data path EU-only, y compris le control plane ?
  5. API OpenAI-compatible - ton code OpenAI SDK existant peut-il pointer dessus juste avec un swap de base_url ?
  6. Prompt logging par défaut - les prompts sont-ils loggés par défaut, ou le logging est-il off par défaut ?
  7. DPA disponible - peux-tu signer un DPA article 28 sur n'importe quel plan (oui / entreprise-only / non) ?
  8. Burn-rate alerts - alerte-t-il proactivement quand la dépense s'envole ?
  9. Taille du catalogue modèles - nombre approximatif de modèles supportés.
  10. Primary job - ce pour quoi le produit est vraiment optimisé : routing, observabilité, ou edge/API-management.

La matrice

Les noms concurrents cliquables mènent à notre page /compare/<slug> plus profonde quand elle existe.

OutilPrixBYOKSmart routingHébergement EUOpenAI-compatPrompt log défautDPABurn-rate alertsCataloguePrimary job
HiWay2LLMMarkup dégressif sur dépense API (9-12,5% selon le volume)OuiNiveau-modèleOui (OVH, France)OuiOffTous les plansOui60+Routing (coût)
OpenRouterReseller, ~5% de margeNonFallback-providerNon (US)OuiOnEntrepriseNon300+Routing (largeur)
LiteLLM OSSGratuit (self-host)OuiFallback-providerSelf-host, tu choisisOuiOff (par config)N/AVia plugins100+Routing (self-hosted)
LiteLLM CloudAbonnement + usageOuiFallback-providerUS primaireOuiConfigurableEntrepriseVia intégrations100+Routing (managé)
Vercel AI GatewayUsage-based sur requêtes proxifiéesOuiFallback-providerEdge a des PoPs EU, control plane USOuiConfigurableEntreprisePartiel40+Routing (Vercel-native)
PortkeyAbonnement fixe + usageOuiNiveau-modèle + fallback-providerUS primaire, EU en entrepriseOuiConfigurableTiers supérieursOui200+Routing + observabilité
HeliconeUsage-based sur requêtes loggéesOui (proxy)Fallback-providerUSOuiOn (cœur du produit)EntreprisePartiel100+Observabilité
Cloudflare AI GatewayUsage-basedOuiFallback-providerEdge global, régional via add-onOuiConfigurableEntreprisePartiel50+Edge (caching + analytics)
LangSmithAbonnement + usageOui (tracing)N/AUSN/A (trace LangChain)On (observabilité)EntrepriseNonN/AObservabilité + éval
RequestyAbonnementOuiNiveau-modèleUSOuiOffEntreprisePartiel80+Routing (coût)
MartianAbonnementOuiNiveau-modèle (pilotée benchmark)USOuiOffEntrepriseNon50+Routing (qualité/coût)
UnifyUsage-basedOuiNiveau-modèle (pilotée benchmark)US/UKOuiConfigurableEntrepriseNon100+Routing (benchmark-selection)
Kong AI GatewayEntreprise (plateforme Kong)OuiFallback-providerSelf-host, tu choisisOuiOff (par config)EntrepriseVia plugins40+API gateway (extension IA)

Deux notes pour lire ça :

Comment utiliser la matrice

Trois manières honnêtes de rétrécir.

Commence par la colonne primary job. Si tu as besoin d'observabilité, la plupart des outils routing-first sont le mauvais point de départ (et vice versa). Helicone et LangSmith sont des produits d'observabilité. Cloudflare et Vercel sont edge/platform-native. HiWay, Portkey, Requesty, Martian, Unify sont routing-first. LiteLLM est routing-en-lib. OpenRouter est routing-en-agrégateur. Kong est une API gateway qui a ajouté une couche IA. Savoir quel job tu achètes coupe la liste en deux.

Ensuite filtre sur le modèle de prix. Reseller vs abonnement fixe vs usage-based vs OSS sont des relations fondamentalement différentes. Si tu as un mandat interne pour éviter la tarification pourcentage-de-dépense, OpenRouter est out. Si tu veux zéro coût fixe, tout ce qui a un abonnement est out. Ça fait généralement passer la liste de six à trois.

Ensuite filtre sur les colonnes compliance qui te concernent. Hébergement EU, prompt logging par défaut, disponibilité du DPA - ce sont des questions oui/non pour la plupart des acheteurs. Si l'hébergement EU est obligatoire, la liste s'effondre sur HiWay, LiteLLM self-hosted, et Kong self-hosted, plus les options EU-entreprise de Portkey et Vercel. C'est généralement une liste assez courte pour demo.

Trois filtres, dix minutes, short-list. Le reste c'est du détail.

Ce que la matrice ne peut pas te dire

Un gros tableau comme celui-là est un bon premier filtre, mais il cache trois choses.

1. La maturité de la logique de routing. "Smart routing niveau-modèle" couvre un spectre allant de "une règle que tu écris à la main en config" à "un modèle de scoring entraîné sur des millions de requêtes". La différence de qualité est énorme, et elle n'apparaît qu'en prod. Demo les 2-3 top candidats avec ton propre trafic.

2. La posture de support. Une gateway d'une startup de 10 personnes et une gateway de Cloudflare se comportent différemment quand quelque chose casse à 3h du matin. Aucune n'est automatiquement meilleure - les startups shippent plus vite, les gros vendors sont plus stables - mais le profil ops est différent.

3. La forme du lock-in vendor. "API OpenAI-compatible" réduit le lock-in énormément, mais pas à zéro. Les primitives workspace, les schémas d'analytics, la syntaxe des règles de fallback - tout ça est spécifique vendor. Migrer c'est en général un après-midi, mais "en général" fait du travail dans cette phrase.

Utilise la matrice pour short-lister. Utilise un POC d'une semaine avec du vrai trafic pour choisir le gagnant.

Deep-dives côte à côte

Les pages /compare/<slug> vont plus loin que cette page ne peut aller - maths de prix, code de migration, comparaison feature par feature, FAQ par concurrent. Celles publiées actuellement :

D'autres sont dans la roadmap. S'il y a une comparaison spécifique qu'il te faut et qu'on n'a pas, dis-le nous.

Conclusion

Douze outils, dix critères, et la vraie décision se résume presque toujours à trois filtres : quel job tu recrutes la gateway pour faire, quel modèle de prix colle à ta courbe de coût, et quelles cases de compliance tu dois cocher. Tout le reste est du détail utile une fois la short-list à trois ou quatre produits - mais c'est du bruit si tu essaies d'évaluer les douze sur chaque axe en parallèle.

Essayer HiWay - BYOK, markup dégressif, hébergé EU

Plan Free pour démarrer, smart routing niveau-modèle, sans CB