HiWay2LLM analiza cada petición en <1ms y la routea al modelo óptimo a través de tus propias claves API. Los mensajes simples van a modelos económicos. Las tareas complejas a los más potentes. Ahorras 40-60 % sobre un mix típico, sin ningún margen.
<1ms
Latencia de routing
9%
Markup mínimo (Enterprise)
0
Prompts almacenados
200+
Modelos - LLM, imagen, vídeo, audio y embeddings
Cómo encaja todo
HiWay2LLM se intercala entre tu código y los proveedores LLM. Tus claves. Tus datos. Nuestra inteligencia de routing.
200+ models · LLM · Image · Video · Audio · Embeddings - all via BYOK
Del registro a tu primera petición routada en menos de 2 minutos.
Cuenta creada en 30 segundos. Email + contraseña, el plan gratuito se activa de inmediato - 2M tokens/mes, sin tarjeta bancaria.
Conecta tus propias claves de cualquier proveedor soportado - LLM (Anthropic, OpenAI, Google, Mistral, Groq…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway), audio (ElevenLabs) o embeddings (Cohere, Voyage AI). Se mantienen cifradas en nuestra base y los proveedores te facturan directamente. Cero margen sobre la inferencia.
Apunta el base_url de tu SDK a HiWay2LLM. Un único endpoint llega a todos los modelos que has activado, y el router elige el modelo más barato capaz de procesar cada petición. Compatible OpenAI. Funciona con cualquier SDK.
Apunta tu código existente a HiWay2LLM. Nosotros nos ocupamos del resto.
Haiku 4.5 / GPT-4o-mini / Gemini 2.5 Flash Lite
65% de las peticiones
Sonnet 4.6 / GPT-4o / Gemini 2.5 Flash
28% de las peticiones
Opus 4.7 / GPT-5 / Gemini 2.5 Pro
7% de las peticiones
7 analizadores, alerting de burn-rate, optimización multi-proveedor - y CORTEX, la IA que auto-ajusta tu router mientras desarrollas.
7 analizadores detectan la intención, la complejidad, las herramientas y el código en menos de un milisegundo. Cero llamada LLM para el routing - CPU pura.
Baseline por agente, detección de la inflación de prompts, las escaladas silenciosas a modelos premium y las desviaciones tarifarias. Alertas, rollback, presupuestos por agente. Diseñado para los CTO que quieren el control total de su gasto LLM.
Vigilamos tu gasto en tiempo real. Umbrales de burn-rate, detección de anomalías y alertas por clave: lanzamos la señal en cuanto algo se desvía - antes de que tu factura lo haga.
Ningún proveedor LLM ofrece esto. Topes diarios/mensuales, límites por modelo, reglas fuera de horario y degradación automática.
Exportaciones CSV por usuario, desglose diario por modelo, atribución de costes al token. Conéctalo a tu facturación en dos clics.
Trae tus propias claves de cualquier proveedor - LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway, Luma), audio (ElevenLabs, HeyGen) y embeddings (Cohere, Voyage AI). Una sola API, todas las modalidades.
Cambia tu base_url. Eso es todo. Compatible con todos los SDK LLM - OpenAI, Anthropic, LangChain, Vercel AI, n8n.
Tus prompts nunca tocan nuestro disco. Garantía arquitectural. Cumple RGPD y AI Act europeo.
IA proactiva que lee los eventos de Guardian, auto-ajusta los umbrales de routing y envía insights a tu CORTEX Inbox - para ver los problemas antes que tus usuarios. Scale y Enterprise.
Escáner de dos capas: inyección, jailbreak, filtración de PII y secretos en menos de 2 ms, antes de llegar al modelo.
Inyección de prompt
Bloquea "ignora todas las instrucciones anteriores", modo DAN y patrones de sustitución de persona.
Extracción de prompt
Detecta intentos de leer tu prompt del sistema o instrucciones internas.
Jailbreak
Detiene solicitudes de malware, exploits, síntesis de sustancias controladas y contenido ilegal.
Detección PII
Marca emails, teléfonos, IBANs e identificadores fiscales antes de llegar al modelo, conforme RGPD.
Filtración de secretos
Detecta claves API (OpenAI, Anthropic, GitHub PAT, tokens Bearer) pegadas accidentalmente en prompts.
CLI en 30 segundos, SDK Python y TypeScript compatibles OpenAI. Ningún vendor-lock: puedes salir de HiWay sin tocar una línea de código de aplicación.
Install en una línea, signup directo, primera llamada desde la terminal. Perfecto para probar antes de codear nada.
npm i -g @hiway2llm/cli hw signup hw chat "explain this in 3 bullets"
Import drop-in. Todos los métodos que existen en el OpenAI SDK funcionan - solo redirigimos al modelo correcto.
pip install hiway2llm
from hiway2llm import Hiway
cli = Hiway(api_key="hw_live_...")
cli.chat("Say hi")Cliente fetch nativo, compatible Node y Edge runtimes (Vercel, Cloudflare Workers).
npm i @hiway2llm/client
import { Hiway } from "@hiway2llm/client";
const h = new Hiway({ apiKey: "hw_live_..." });
await h.chat("Say hi");Conserva tu clave Anthropic, paga a Anthropic directamente. HiWay mide el consumo y factura un markup % sobre el coste real enrutado - ampliamente compensado por el ahorro de routing.
Empieza gratis. Escala cuando estés listo.
Sin tarjeta de crédito · Cancela cuando quieras · Acceso inmediato
Routage intelligent − frais HiWay2LLM = gain net
Profil d'usage
Mix estimé : 40% Haiku · 50% Sonnet · 10% Opus
Économie nette / mois
+$501
soit +50% sur ta facture actuelle
Simulation indicative · basée sur le mix modèles typique de votre profil
Free
Pour tester et prototyper.
Scale
jusqu'à
−60%sur tes coûts IA réels · CORTEX route vers le modèle optimal
Dégressif : <$500 → 12,5% · $500-5K → 11% · $5K-20K → 10%
Enterprise
$20K-50K/mois → 9% · au-delà : sur-mesure négocié
Toutes les fonctionnalités core sont disponibles dès le premier pack. Les features avancées s'ouvrent avec Scale et Enterprise.
| Fonctionnalité | FreeRoutage de base · 10M/mois | ScaleMarkup 12,5 → 10% | EnterpriseSur devis |
|---|---|---|---|
| USAGE & QUOTAS | |||
| Tokens inclus | par pack acheté | 1B / achat | custom |
| Auto-reload | |||
| Sièges équipe | 3 | 25 | ∞ |
| Workspaces | 1 | 5 | ∞ |
| Conservation analytics | 30j | 1 an | ∞ |
| MOTEUR DE ROUTAGE | |||
| Smart routing (model=auto) | |||
| BYOK fournisseurs | |||
| 0 % marge sur l'inférence | |||
| Fallback automatique | |||
| Guardian anti-loop | |||
| CORTEX alertes Inbox | |||
| CONTRÔLES AVANCÉS | |||
| Cache sémantique | |||
| A/B testing modèles | |||
| Journal d'audit | |||
| CORTEX complet (5 phases) | |||
| SSO (Google, Microsoft) | |||
| Masquage PII | |||
| Self-hosted | |||
| Règles routage custom | |||
| SUPPORT & CONFORMITÉ | |||
| Canal de support | Priority | SLA 99.99% | |
| DPA (RGPD) | |||
| Financement disponible | |||
| Ingénieur dédié | |||
L'inférence est toujours facturée directement par vos fournisseurs LLM, sur vos propres clés. Les prix ci-dessus n'incluent pas l'inférence.
INCLUIDO EN CADA PLAN
BYOK - trae tus propias claves de cualquier proveedor soportado: LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate, Cohere…), imagen (Flux/BFL, Stability AI, fal.ai), vídeo (Kling, Runway, Luma AI), audio (ElevenLabs, HeyGen). La inferencia la facturan directamente tus proveedores. HiWay solo cobra un markup % sobre el coste real enrutado.
Tus usuarios envían mensajes simples el 70% del tiempo. ¿Por qué pagar el precio de Opus por un hola?
Empezar gratisComparativa honesta. Actualizado el 2026-04-22 contra la documentación pública de cada proveedor.
| Característica | HiWay2LLM | OpenRouter | Portkey | LiteLLM | Requesty |
|---|---|---|---|---|---|
| Trae tus propias claves (BYOK) | |||||
| Routing inteligente por complejidad de petición | |||||
| API compatible con OpenAI | |||||
| Fallback automático entre providers | |||||
| Prompt caching (Anthropic / OpenAI) | |||||
| Analítica por workspace + audit log | |||||
| Alertas burn-rate (picos de presupuesto) | |||||
| Hosting en UE por defecto (RGPD) | self-host | ||||
| Cero logging de prompts | |||||
| Auto-gestión IA (CORTEX) | |||||
| Modelo de pricing | tarifa fija €/mes | % recargo | fija + % recargo | self-host / SaaS | % recargo |
nativo · parcial / plugin · no ofrecido. Verificamos cada afirmación contra la documentación pública del provider - si detectas un error, dínoslo.