April 202611 min de lectureJohan Bretonneau

Le guide honnête pour choisir un router LLM en 2026
Un framework de décision, pas un pitch produit

Un framework de décision pour choisir un router LLM en 2026. Sept questions, un flowchart, et des réponses honnêtes sur quand chaque option gagne — HiWay inclus.

Si tu cherches "meilleur router LLM 2026" tu vas trouver une douzaine de posts qui les rankent de 1 à 10, et la plupart sont optimisés pour celui qui tient le blog. Celui-là essaye de ne pas l'être. Le but ici c'est de te donner un framework de décision qui marche pour ton équipe, honnêtement, avec HiWay qui apparaît comme une réponse parmi plusieurs — parce que c'est la vérité.

Sept questions. À la fin tu auras réduit 20+ options à 1-3.

Question 1 : Quelle est ta trajectoire de dépense mensuelle ?

C'est le premier filtre et il trie tout le reste.

Quasi-zéro / hobby project. Un tier gratuit (HiWay Free te donne 2 500 req/mois) ou un appel provider direct suffit largement. Smart routing et fallback sont du nice-to-have à cette échelle, pas décisifs.

Quelques centaines à quelques milliers d'€ / mois. Une gateway paye vite. Le smart routing seul (downgrade auto des requêtes simples vers des modèles moins chers) coupe typiquement 40-85% de la facture d'inférence — indépendant du volume. Commodité d'intégration, observability, et contrôles de coût basiques valent l'abonnement par-dessus. Toutes les options ci-dessous marchent.

2 000 € à 20 000 €/mois. Le modèle de pricing compte beaucoup. Le pricing markup compound contre toi. Les abonnements flat ou modèles BYOK deviennent significativement moins chers, et le smart routing compound par-dessus. La profondeur des features (budgets par endpoint, alertes burn-rate) a un ROI concret.

20 000 €+/mois. Tu es en territoire enterprise. Pricing custom, support dédié, engagements compliance comptent. Parle aux équipes commerciales, pas aux pages marketing.

Ce n'est pas une prescription — tu peux choisir n'importe quelle gateway à n'importe quelle échelle. C'est une prescription sur ce qu'il faut pondérer le plus en choisissant. Et note que les leviers indépendants du volume (smart routing, BYOK, hosting UE) n'ont pas besoin que tu passes un seuil de dépense pour être rentables.

Question 2 : As-tu besoin d'hosting UE ?

Binaire. Réponds oui ou non.

Oui, exigence dure (compliance, secteur régulé, mandat client). Ta short list tombe à : HiWay, LiteLLM self-hosté en région UE, ou Helicone OSS self-hosté en UE. Tout le reste est hors table tant que tu n'as pas un engagement régional précis signé.

Préférence soft (nice to have, pas un deal-breaker). Tu peux considérer les options US-hosted avec régions UE — certains tiers enterprise Portkey, Vercel AI Gateway si tu es sur Vercel avec régions UE. Mais reconnais que tu compromets sur la résidence des données pour la richesse des features.

Non. La liste complète est dispo.

Question 3 : Tu veux BYOK ou le markup revendeur te va ?

BYOK. Tu veux tes clés provider dans tes comptes, les providers qui te facturent directement, pas de markup sur l'inférence. Short list : HiWay, LiteLLM (self-hosté), Helicone (self-hosté ou cloud avec BYOK), Portkey (avec config BYOK), Cloudflare AI Gateway.

Le revendeur me va. Tu veux un signup en un clic, une carte de crédit, pas de comptes provider à gérer. Short list : OpenRouter, Requesty, autres aggregators.

La question BYOK est souvent un proxy pour "combien je me soucie de l'alignement de coût sur 12+ mois ?" Si ton horizon est court et ta dépense petite, le markup va bien. Si tu joues long, le BYOK paye.

Question 4 : Où héberges-tu ton app ?

Vercel + Next.js + Vercel AI SDK. Le Vercel AI Gateway a un avantage d'intégration dur à battre si c'est ton contexte. Considère-le en premier, évalue les alternatives seulement si d'autres contraintes entrent en jeu.

Cloudflare (Workers, Pages). Cloudflare AI Gateway a un avantage de proximité edge. Même logique : premier choix si c'est ta stack.

AWS, GCP, tes propres serveurs, Fly, Render, Hetzner, VPS, Kubernetes. Pas d'avantage gateway plateforme précis. Choisis sur features, pricing, et région d'hosting. HiWay, LiteLLM, Portkey, Helicone marchent équivalemment depuis cette position.

Mixte. La gateway qui gagne est celle avec l'interface compatible OpenAI la plus propre, parce que c'est la plus facile à intégrer sur des déploiements hétérogènes. La plupart des gateways modernes fit.

Question 5 : Tu veux du routing intelligent, ou juste du fallback ?

Routing intelligent veut dire : la gateway lit le prompt (ou les metadata) et choisit le meilleur tier de modèle par requête. Salutation simple → modèle pas cher. Raisonnement dur → flagship. La gateway a des opinions.

Routing de fallback veut dire : la gateway appelle le modèle A ; si A échoue, elle essaye B ; si B échoue, elle essaye C. La gateway n'a pas d'opinions sur ce qui est le mieux, elle essaye juste dans l'ordre.

Si tu veux le routing intelligent comme feature first-class : HiWay, Martian, LiteLLM avec config de routing custom, ou un spécialiste router-first. La plupart des gateways managées le supportent à un certain niveau mais varient en sophistication.

Si le fallback suffit : globalement toutes les gateways le supportent. Choisis sur d'autres critères.

Le ROI du routing intelligent est le plus gros quand ton workload est hétérogène — mélange de salutations, questions complexes, tool use, structured outputs. Si ton app fait une seule chose avec un seul modèle, tu n'as pas besoin de routing intelligent. Tu as besoin d'un bon fallback.

Économiser maintenant →

Aucune carte bancaire requise

Question 6 : As-tu de la capacité platform engineering ?

Oui, platform engineer dédié, infra Kubernetes/PostgreSQL/Redis existante. Le self-hosting est sur la table. LiteLLM ou Helicone OSS sont des réponses légitimes. Tu dépenseras du temps d'ingé, mais tu économiseras du cash et garderas le contrôle.

Non, petite équipe focus produit. Gateways managées seulement. L'overhead d'ingé du self-hosting va manger ta vélocité produit. Choisis une option managée qui matche tes autres réponses.

Cette question tue beaucoup de débats "devrais-je utiliser LiteLLM ?". Si ton équipe ne peut pas gérer l'ops, les économies OSS sont une illusion — tu payes en heures d'ingé à 2h du mat au lieu de dollars vendor sur une facture prévisible.

Question 7 : Qu'est-ce qui compte le plus sur 24 mois — features, alignement de coût, ou compliance ?

C'est la question de pondération.

Les features pèsent le plus. Tu veux l'UI d'observability la plus riche, la gestion de prompts la plus soignée, l'intégration la plus profonde avec les evals. Helicone, Portkey, LangSmith pèsent plus.

L'alignement de coût pèse le plus. Tu veux une gateway dont le revenu ne grossit pas quand le tien grossit. BYOK + flat par requête ou OSS self-hosté pèsent plus. HiWay, LiteLLM, Helicone (self-hosté) pèsent plus.

La compliance pèse le plus. Hosting UE, précision du DPA, transparence sous-processeurs, entité UE. HiWay ou LiteLLM UE self-hosté pèsent plus.

La plupart des équipes pondèrent les trois, mais il y en a généralement un disproportionnellement important. Identifie-le et laisse-le casser les égalités.

Le flowchart, en ASCII

START
  │
  ▼
Dépense quasi-nulle / hobby project ?
  ├── Oui → HiWay Free (2,5K req/mois) ou direct. Stop.
  └── Non
       │
       ▼
   Besoin hosting UE ?
       ├── Oui dur → [HiWay | LiteLLM UE | Helicone OSS UE]
       ├── Oui soft → [Portkey UE | Vercel UE | self-host UE]
       └── Non → continue
                │
                ▼
            BYOK ou markup OK ?
                ├── BYOK → [HiWay | LiteLLM | Helicone | Portkey BYOK]
                └── Markup OK → [OpenRouter | Requesty | aggregators]
                                                │
                                                ▼
                                         Sur Vercel ?
                                            ├── Oui → Vercel AI Gateway
                                            └── Non
                                                  │
                                                  ▼
                                         Sur Cloudflare ?
                                             ├── Oui → Cloudflare AI Gateway
                                             └── Non → router dédié
                                                              │
                                                              ▼
                                                        Platform engineering ?
                                                           ├── Oui → [LiteLLM | Helicone OSS]
                                                           └── Non → [HiWay | Portkey | Helicone managé]

Descends tes contraintes dans l'arbre. Tu atterris sur une feuille avec 1-3 noms.

Comment HiWay apparaît dans le framework

Pour la transparence, voici où HiWay est la bonne réponse :

  • Toute dépense prod où la facture d'inférence mérite d'être rognée (smart routing paye à toute échelle)
  • Hosting UE exigence dure ou préférence forte
  • BYOK exigence dure ou préférence forte
  • Tu n'es pas locked dans l'écosystème Vercel ou Cloudflare (ou tu y es mais l'hosting UE gagne)
  • Tu veux du routing intelligent comme feature first-class
  • Tu n'as pas de capacité platform engineering dédiée (ou tu en as mais veux la libérer pour le produit)
  • Alignement de coût ou compliance pèsent le plus vs features

Si tes réponses te mettent là, on aimerait gagner ton trafic. Si tes réponses te mettent ailleurs, utilise l'option ailleurs. Ce n'est pas de la fausse modestie ; c'est la vérité sur ce pour quoi on est optimisés.

Anti-patterns communs

Choisir par popularité Twitter

Les outils LLM les plus bruyants sur Twitter ne sont pas nécessairement les meilleurs pour ton équipe. Le volume de marketing ne corrèle pas avec le fit. Fais le framework.

Choisir par nombre de features

Plus de features ne veut pas dire mieux. Une gateway avec 47 features dont 4 sont super et 43 médiocres est pire qu'une gateway avec 12 features bien faites. Demande quelle est l'opinion de chaque gateway sur ce qui compte.

Choisir par "le plus mature"

Les gateways matures ont des outils ops profonds et des features poussiéreuses que tu n'utiliseras jamais. Les gateways plus récentes ont des surfaces de features étroites focus sur les best practices actuelles. Mature n'est pas automatiquement mieux.

Choisir par le sticker le moins cher

Le prix sticker n'est pas le coût total. Une gateway pas chère avec un markup de 5 % est plus chère à l'échelle qu'un abonnement flat à un sticker plus élevé. Fais le calcul 12 mois avec ta dépense projetée.

Ne jamais re-review la décision

Le marché a beaucoup bougé de 2024 à 2026 et il va bouger encore d'ici 2028. Quoi que tu choisisses maintenant, mets un rappel calendrier pour re-évaluer dans 12 mois. Ta dépense aura grossi, tes contraintes auront bougé, et le paysage aura changé.

Un exemple travaillé

Faisons tourner le framework pour une équipe hypothétique : SaaS B2B français 10 personnes servant des boîtes d'assurance, 4 000 €/mois de dépense LLM, en croissance de 20 % mois sur mois. Équipe compliance stricte. App hébergée sur leur propre Kubernetes sur OVH. Équipe de devs, pas de platform engineer dédié.

  • Q1 (dépense) : 4K €/mois, en croissance. Le modèle de pricing compte. Pricing flat attractif.
  • Q2 (hosting UE) : Oui dur, compliance assurance. Options US-hosted hors table.
  • Q3 (BYOK) : BYOK préféré pour facturation transparente et contrôle. Markup revendeur pas attractif.
  • Q4 (hosting) : Kubernetes propre sur OVH. Pas d'avantage gateway spécifique plateforme.
  • Q5 (routing) : Workload mixte, routing intelligent a ROI clair. Veut support first-class.
  • Q6 (capacité plateforme) : Pas de platform engineer dédié. LiteLLM self-hosté risqué.
  • Q7 (pondération) : Compliance pèse le plus, suivie par alignement de coût.

Le framework réduit cette équipe à : HiWay, ou possiblement LiteLLM s'ils peuvent allouer une fraction d'ingé pour le faire tourner. Vu Q6, HiWay est la réponse plus sûre. Une gateway BYOK managée UE-hosted avec pricing flat et routing intelligent matche chaque contrainte.

C'est un vrai pattern. On a des clients qui ressemblent exactement à ça.

Un contre-exemple travaillé

Maintenant une équipe où HiWay n'est pas la réponse : startup US 3 personnes, 300 $/mois de dépense LLM, prototypant vite, pas de contraintes compliance, hébergé sur Vercel avec Next.js et le Vercel AI SDK.

  • Q1 (dépense) : Faible, la commodité domine.
  • Q2 (hosting UE) : Pas besoin.
  • Q3 (BYOK) : Markup va bien à cette échelle.
  • Q4 (hosting) : Vercel + Next.js + Vercel AI SDK. Avantage d'intégration énorme.
  • Q5 (routing) : Le fallback suffit pour l'instant.
  • Q6 (capacité plateforme) : Trois personnes, toutes produit.
  • Q7 (pondération) : Features et vitesse, pas alignement de coût.

Le framework réduit cette équipe à : Vercel AI Gateway ou OpenRouter. HiWay n'est pas compétitif ici, et on ne prétendrait pas le contraire. Prends le Vercel AI Gateway si tu veux l'intégration serrée. Prends OpenRouter si tu veux le catalogue de modèles le plus large et l'onboarding en un clic.

Le takeaway

Il n'y a pas de meilleur router LLM universel en 2026. Il y a le bon pour tes réponses à sept questions. La plupart des posts "top 10" sautent direct aux features parce que les features sont plus faciles à comparer que les contraintes — mais les contraintes sont ce qui décide vraiment.

Déroule le framework. Réduis ta liste. Fais les calculs contre ton usage projeté sur 12 mois. Prends celui qui fit ta forme.

Si HiWay fit, on serait content de te voir. Sinon, sincèrement — utilise ce qui fit, et reviens dans un an.


C'est le dernier post de cette série. Si tu veux tout l'argument en un fil : les modèles de pricing comptent, l'hosting UE est une vraie exigence pour certaines équipes, le BYOK aligne les incitations, et la bonne gateway pour toi dépend de contraintes que tu n'as probablement pas écrites. Maintenant tu les as.

Partager

LinkedInXEmail

Cet article t'a servi ?

Commentaires

Sois le premier à commenter.