April 202611 min readJohan Bretonneau

La guía honesta para elegir un router LLM en 2026
Un framework de decisión, no un pitch de producto

Un framework de decisión para elegir un router LLM en 2026. Siete preguntas, un flowchart, y respuestas honestas sobre cuándo gana cada opción — HiWay incluido.

Si buscas "mejor router LLM 2026" vas a encontrar una docena de posts que los rankean del 1 al 10, y la mayoría están optimizados para quien gestiona el blog. Este intenta no serlo. La meta aquí es darte un framework de decisión que funcione para tu equipo, honestamente, con HiWay apareciendo como una respuesta entre varias — porque esa es la verdad.

Siete preguntas. Al final habrás reducido 20+ opciones a 1-3.

Pregunta 1: ¿Cuál es tu trayectoria de gasto mensual?

Es el primer filtro y ordena todo lo demás.

Casi cero / hobby project. Un tier gratis (HiWay Free te da 2.500 req/mes) o una llamada directa al proveedor sobra. Smart routing y fallback son nice-to-have a esta escala, no decisivos.

Unos cientos a unos miles de € / mes. Una gateway se paga rápido. El smart routing solo (auto-downgrade de las requests simples a modelos más baratos) suele recortar 40-85% de la factura de inferencia — independiente del volumen. Conveniencia de integración, observability y controles de coste básicos compensan la suscripción por encima. Todas las opciones de abajo funcionan.

2.000 € a 20.000 €/mes. El modelo de pricing pesa mucho. El pricing markup acumula en tu contra. Las suscripciones flat o los modelos BYOK se vuelven significativamente más baratos, y el smart routing acumula encima. La profundidad de features (presupuestos por endpoint, alertas burn-rate) tiene ROI concreto.

20.000 €+/mes. Estás en territorio enterprise. Pricing custom, soporte dedicado, compromisos de compliance pesan. Habla con los equipos comerciales, no con las páginas de marketing.

No es una prescripción — puedes elegir cualquier gateway a cualquier escala. Es una prescripción sobre qué pesar más al elegir. Y nota que las palancas independientes del volumen (smart routing, BYOK, hosting UE) no necesitan que cruces un umbral de gasto para ser rentables.

Pregunta 2: ¿Necesitas hosting UE?

Binario. Responde sí o no.

Sí, requisito duro (compliance, sector regulado, mandato del cliente). Tu short list cae a: HiWay, LiteLLM self-hosteado en región UE, o Helicone OSS self-hosteado en UE. Todo lo demás está fuera de la mesa hasta que tengas un compromiso regional preciso firmado.

Preferencia blanda (nice to have, no deal-breaker). Puedes considerar opciones US-hosted con regiones UE — algunos tiers enterprise de Portkey, Vercel AI Gateway si estás sobre Vercel con regiones UE. Pero reconoce que estás cediendo en residencia de datos por riqueza de features.

No. Lista completa disponible.

Pregunta 3: ¿Quieres BYOK o te vale el markup del revendedor?

BYOK. Quieres tus claves de proveedor en tus cuentas, los proveedores facturándote directamente, sin markup sobre la inferencia. Short list: HiWay, LiteLLM (self-hosteado), Helicone (self-hosteado o cloud con BYOK), Portkey (con config BYOK), Cloudflare AI Gateway.

Me vale el revendedor. Quieres signup en un click, una tarjeta de crédito, sin cuentas de proveedor que gestionar. Short list: OpenRouter, Requesty, otros aggregators.

La pregunta de BYOK suele ser un proxy de "¿cuánto me importa la alineación de coste sobre 12+ meses?". Si tu horizonte es corto y tu gasto pequeño, el markup va bien. Si juegas a largo, el BYOK paga.

Pregunta 4: ¿Dónde alojas tu app?

Vercel + Next.js + Vercel AI SDK. El Vercel AI Gateway tiene una ventaja de integración difícil de batir si ese es tu contexto. Considéralo el primero, evalúa alternativas solo si entran en juego otras restricciones.

Cloudflare (Workers, Pages). Cloudflare AI Gateway tiene una ventaja de proximidad edge. Misma lógica: primera elección si esa es tu stack.

AWS, GCP, tus propios servidores, Fly, Render, Hetzner, VPS, Kubernetes. Sin ventaja de gateway específica de plataforma. Elige por features, pricing y región de hosting. HiWay, LiteLLM, Portkey, Helicone funcionan equivalentemente desde esa posición.

Mixto. La gateway que gana es la de la interfaz compatible OpenAI más limpia, porque es la más fácil de integrar sobre despliegues heterogéneos. La mayoría de gateways modernas encajan.

Pregunta 5: ¿Quieres routing inteligente, o solo fallback?

Routing inteligente significa: la gateway lee el prompt (o los metadata) y elige el mejor tier de modelo por request. Saludo simple → modelo barato. Razonamiento duro → flagship. La gateway tiene opiniones.

Routing de fallback significa: la gateway llama al modelo A; si A falla, prueba B; si B falla, prueba C. La gateway no tiene opiniones sobre qué es mejor, solo prueba en orden.

Si quieres routing inteligente como feature first-class: HiWay, Martian, LiteLLM con config de routing custom, o un especialista router-first. La mayoría de gateways gestionadas lo soportan a algún nivel pero varían en sofisticación.

Si el fallback sobra: en general todas las gateways lo soportan. Elige por otros criterios.

El ROI del routing inteligente es máximo cuando tu workload es heterogéneo — mezcla de saludos, preguntas complejas, tool use, structured outputs. Si tu app hace una sola cosa con un solo modelo, no necesitas routing inteligente. Necesitas un buen fallback.

Empezar a ahorrar →

Sin tarjeta de crédito

Pregunta 6: ¿Tienes capacidad de platform engineering?

Sí, platform engineer dedicado, infra Kubernetes/PostgreSQL/Redis existente. El self-hosting está sobre la mesa. LiteLLM o Helicone OSS son respuestas legítimas. Vas a gastar tiempo de ingeniería, pero ahorrarás cash y mantendrás el control.

No, equipo pequeño focus producto. Solo gateways gestionadas. El overhead de ingeniería del self-hosting va a comerse tu velocidad de producto. Elige una opción gestionada que case con tus otras respuestas.

Esta pregunta mata muchos debates "¿debería usar LiteLLM?". Si tu equipo no puede gestionar la operación, los ahorros OSS son una ilusión — pagas en horas de ingeniería a las 2 de la madrugada en vez de en dólares de vendor sobre una factura predecible.

Pregunta 7: ¿Qué pesa más sobre 24 meses — features, alineación de coste, o compliance?

Esta es la pregunta de ponderación.

Las features pesan más. Quieres la UI de observability más rica, la gestión de prompts más pulida, la integración más profunda con los evals. Helicone, Portkey, LangSmith pesan más.

La alineación de coste pesa más. Quieres una gateway cuyo revenue no crezca cuando el tuyo crece. BYOK + flat por request o OSS self-hosteado pesan más. HiWay, LiteLLM, Helicone (self-hosteado) pesan más.

La compliance pesa más. Hosting UE, precisión del DPA, transparencia de sub-procesadores, entidad UE. HiWay o LiteLLM UE self-hosteado pesan más.

La mayoría de equipos ponderan los tres, pero suele haber uno desproporcionadamente importante. Identifícalo y déjalo que rompa los empates.

El flowchart, en ASCII

START
  │
  ▼
¿Gasto casi nulo / hobby project?
  ├── Sí → HiWay Free (2,5K req/mes) o directo. Stop.
  └── No
       │
       ▼
   ¿Necesitas hosting UE?
       ├── Sí duro → [HiWay | LiteLLM UE | Helicone OSS UE]
       ├── Sí blando → [Portkey UE | Vercel UE | self-host UE]
       └── No → continúa
                │
                ▼
            ¿BYOK o markup OK?
                ├── BYOK → [HiWay | LiteLLM | Helicone | Portkey BYOK]
                └── Markup OK → [OpenRouter | Requesty | aggregators]
                                                │
                                                ▼
                                         ¿Sobre Vercel?
                                            ├── Sí → Vercel AI Gateway
                                            └── No
                                                  │
                                                  ▼
                                         ¿Sobre Cloudflare?
                                             ├── Sí → Cloudflare AI Gateway
                                             └── No → router dedicado
                                                              │
                                                              ▼
                                                        ¿Platform engineering?
                                                           ├── Sí → [LiteLLM | Helicone OSS]
                                                           └── No → [HiWay | Portkey | Helicone gestionado]

Baja tus restricciones por el árbol. Aterrizas en una hoja con 1-3 nombres.

Cómo aparece HiWay en el framework

Por transparencia, aquí donde HiWay es la respuesta correcta:

  • Cualquier gasto en producción donde la factura de inferencia merezca recortarse (smart routing paga a cualquier escala)
  • Hosting UE como requisito duro o preferencia fuerte
  • BYOK como requisito duro o preferencia fuerte
  • No estás locked en el ecosistema Vercel o Cloudflare (o lo estás pero el hosting UE gana)
  • Quieres routing inteligente como feature first-class
  • No tienes capacidad de platform engineering dedicada (o sí pero quieres liberarla para producto)
  • Alineación de coste o compliance pesan más vs features

Si tus respuestas te ponen ahí, nos encantaría ganar tu tráfico. Si tus respuestas te ponen en otro lado, usa la opción de otro lado. No es falsa modestia; es la verdad sobre para qué estamos optimizados.

Anti-patterns comunes

Elegir por popularidad en Twitter

Las herramientas LLM más ruidosas en Twitter no son necesariamente las mejores para tu equipo. El volumen de marketing no correlaciona con el fit. Haz el framework.

Elegir por número de features

Más features no significa mejor. Una gateway con 47 features de las que 4 son brutales y 43 mediocres es peor que una gateway con 12 features bien hechas. Pregunta cuál es la opinión de cada gateway sobre lo que importa.

Elegir por "la más madura"

Las gateways maduras tienen herramientas de ops profundas y features polvorientas que nunca vas a usar. Las gateways más recientes tienen superficies de feature estrechas centradas en las best practices actuales. Madura no es automáticamente mejor.

Elegir por la pegatina de precio más baja

El precio sticker no es el coste total. Una gateway barata con un markup del 5% es más cara a escala que una suscripción flat con sticker más alto. Haz el cálculo a 12 meses con tu gasto proyectado.

No re-revisar nunca la decisión

El mercado se ha movido mucho de 2024 a 2026 y se va a mover más para 2028. Lo que elijas ahora, ponte un recordatorio en el calendario para reevaluar en 12 meses. Tu gasto habrá crecido, tus restricciones habrán cambiado, y el paisaje habrá cambiado.

Un ejemplo trabajado

Hagamos correr el framework para un equipo hipotético: SaaS B2B francés de 10 personas sirviendo a aseguradoras, 4.000 €/mes de gasto LLM, creciendo 20% mes a mes. Equipo compliance estricto. App alojada en su propio Kubernetes sobre OVH. Equipo de devs, sin platform engineer dedicado.

  • Q1 (gasto): 4K €/mes, en crecimiento. El modelo de pricing pesa. Pricing flat atractivo.
  • Q2 (hosting UE): Sí duro, compliance asegurador. Opciones US-hosted fuera de la mesa.
  • Q3 (BYOK): BYOK preferido por facturación transparente y control. Markup revendedor poco atractivo.
  • Q4 (hosting): Kubernetes propio sobre OVH. Sin ventaja de gateway específica de plataforma.
  • Q5 (routing): Workload mixto, routing inteligente tiene ROI claro. Quiere soporte first-class.
  • Q6 (capacidad de plataforma): Sin platform engineer dedicado. LiteLLM self-hosteado arriesgado.
  • Q7 (ponderación): Compliance pesa más, seguida por alineación de coste.

El framework reduce este equipo a: HiWay, o posiblemente LiteLLM si pueden dedicar una fracción de ingeniería para mantenerlo. Visto Q6, HiWay es la respuesta más segura. Una gateway BYOK gestionada UE-hosted con pricing flat y routing inteligente casa con cada restricción.

Es un patrón real. Tenemos clientes que se parecen exactamente a esto.

Un contraejemplo trabajado

Ahora un equipo donde HiWay no es la respuesta: startup US de 3 personas, 300 $/mes de gasto LLM, prototipando rápido, sin restricciones de compliance, alojada en Vercel con Next.js y el Vercel AI SDK.

  • Q1 (gasto): Bajo, la conveniencia domina.
  • Q2 (hosting UE): No hace falta.
  • Q3 (BYOK): El markup va bien a esta escala.
  • Q4 (hosting): Vercel + Next.js + Vercel AI SDK. Ventaja de integración enorme.
  • Q5 (routing): El fallback sobra por ahora.
  • Q6 (capacidad de plataforma): Tres personas, todas producto.
  • Q7 (ponderación): Features y velocidad, no alineación de coste.

El framework reduce este equipo a: Vercel AI Gateway u OpenRouter. HiWay no es competitivo aquí, y no pretenderíamos lo contrario. Coge el Vercel AI Gateway si quieres la integración estrecha. Coge OpenRouter si quieres el catálogo de modelos más amplio y onboarding en un click.

El takeaway

No hay un mejor router LLM universal en 2026. Está el correcto para tus respuestas a siete preguntas. La mayoría de los posts "top 10" saltan directos a las features porque las features son más fáciles de comparar que las restricciones — pero las restricciones son las que realmente deciden.

Despliega el framework. Reduce tu lista. Haz los cálculos contra tu uso proyectado a 12 meses. Coge el que case con tu forma.

Si HiWay encaja, estaremos contentos de verte. Si no, sinceramente — usa lo que encaje, y vuelve en un año.


Este es el último post de la serie. Si quieres todo el argumento en un hilo: los modelos de pricing pesan, el hosting UE es un requisito real para algunos equipos, el BYOK alinea los incentivos, y la gateway correcta para ti depende de restricciones que probablemente no has escrito. Ahora ya las tienes.

Share

Was this useful?

Comments

Be the first to comment.