Disponible ahora· 200+ Modelos · LLM · Imagen · Vídeo · Audio · BYOK

Usa el mejor modelo.
Paga el precio del más barato.

HiWay2LLM analiza cada petición en <1ms y la routea al modelo óptimo a través de tus propias claves API. Los mensajes simples van a modelos económicos. Las tareas complejas a los más potentes. Ahorras 40-60 % sobre un mix típico, sin ningún margen.

<1ms

Latencia de routing

9%

Markup mínimo (Enterprise)

0

Prompts almacenados

200+

Modelos - LLM, imagen, vídeo, audio y embeddings

Cómo encaja todo

Una capa fina entre tu app y los modelos

HiWay2LLM se intercala entre tu código y los proveedores LLM. Tus claves. Tus datos. Nuestra inteligencia de routing.

Chatbot de cliente
Agente autónomo
Pipeline RAG
CLI / script
1. petición
4. respuesta
Capa de routing
HiWay2LLM
Smart routing
Elige el modelo más barato capaz para cada petición.
Bóveda BYOK
Tus claves de proveedor, cifradas AES-GCM por workspace.
0 % de margen
Los proveedores te facturan directamente. Cero margen sobre la inferencia.
Guardian
Anti-loop + kill-switch burn-rate antes de que salga una llamada dudosa.
Routing por debajo del milisegundo
< 1 ms
2. routada
3. stream
AnthropicBYOK
OpenAIBYOK
GoogleBYOK
MistralBYOK
GroqBYOK
xAIBYOK
40-60%
ahorro típico vs flagship sistemático
0%
de margen sobre la inferencia - nunca
< 1 ms
latencia de la decisión de routing
10+
proveedores soportados, API compatible OpenAI

200+ models · LLM · Image · Video · Audio · Embeddings - all via BYOK

OpenAI
Anthropic
Google
Mistral
DeepSeek
Groq
xAI
Perplexity
Meta Llama
Cohere
Together AI
Azure OpenAI
Stability AI
BFL / Flux
fal.ai
Kling
Runway
Luma AI
ElevenLabs
HeyGen
Voyage AI
Fireworks
Replicate
OpenAI
Anthropic
Google
Mistral
DeepSeek
Groq
xAI
Perplexity
Meta Llama
Cohere
Together AI
Azure OpenAI
Stability AI
BFL / Flux
fal.ai
Kling
Runway
Luma AI
ElevenLabs
HeyGen
Voyage AI
Fireworks
Replicate

Empieza en 3 pasos

Del registro a tu primera petición routada en menos de 2 minutos.

1

Crea una cuenta

Cuenta creada en 30 segundos. Email + contraseña, el plan gratuito se activa de inmediato - 2M tokens/mes, sin tarjeta bancaria.

@
G
f
2

Añade tus claves de proveedor

Conecta tus propias claves de cualquier proveedor soportado - LLM (Anthropic, OpenAI, Google, Mistral, Groq…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway), audio (ElevenLabs) o embeddings (Cohere, Voyage AI). Se mantienen cifradas en nuestra base y los proveedores te facturan directamente. Cero margen sobre la inferencia.

Apr 12$100
Apr 8$25
3

Cambia una línea. Eso es todo.

Apunta el base_url de tu SDK a HiWay2LLM. Un único endpoint llega a todos los modelos que has activado, y el router elige el modelo más barato capaz de procesar cada petición. Compatible OpenAI. Funciona con cualquier SDK.

HIWAY_API_KEY
••••••••••••••

Cambia una línea. Ahorra 50%.

Apunta tu código existente a HiWay2LLM. Nosotros nos ocupamos del resto.

app.py
from openai import OpenAI
client = OpenAI(base_url="https://api.anthropic.com/v1")
client = OpenAI(base_url="https://app.hiway2llm.com/v1")
# Eso es todo. Mismo código. 50% más barato.

Light

Haiku 4.5 / GPT-4o-mini / Gemini 2.5 Flash Lite

65% de las peticiones

Standard

Sonnet 4.6 / GPT-4o / Gemini 2.5 Flash

28% de las peticiones

Heavy

Opus 4.7 / GPT-5 / Gemini 2.5 Pro

7% de las peticiones

No solo routing. Inteligencia.

7 analizadores, alerting de burn-rate, optimización multi-proveedor - y CORTEX, la IA que auto-ajusta tu router mientras desarrollas.

Routing < 1ms

7 analizadores detectan la intención, la complejidad, las herramientas y el código en menos de un milisegundo. Cero llamada LLM para el routing - CPU pura.

Control Layer - Anti-deriva

Baseline por agente, detección de la inflación de prompts, las escaladas silenciosas a modelos premium y las desviaciones tarifarias. Alertas, rollback, presupuestos por agente. Diseñado para los CTO que quieren el control total de su gasto LLM.

Alerting Burn-Rate

Vigilamos tu gasto en tiempo real. Umbrales de burn-rate, detección de anomalías y alertas por clave: lanzamos la señal en cuanto algo se desvía - antes de que tu factura lo haga.

Control Presupuestario Avanzado

Ningún proveedor LLM ofrece esto. Topes diarios/mensuales, límites por modelo, reglas fuera de horario y degradación automática.

Informes de uso

Exportaciones CSV por usuario, desglose diario por modelo, atribución de costes al token. Conéctalo a tu facturación en dos clics.

200+ Modelos, Todas las Modalidades

Trae tus propias claves de cualquier proveedor - LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway, Luma), audio (ElevenLabs, HeyGen) y embeddings (Cohere, Voyage AI). Una sola API, todas las modalidades.

Integración en 1 Línea

Cambia tu base_url. Eso es todo. Compatible con todos los SDK LLM - OpenAI, Anthropic, LangChain, Vercel AI, n8n.

Cero Registro de Prompts

Tus prompts nunca tocan nuestro disco. Garantía arquitectural. Cumple RGPD y AI Act europeo.

Orquestador IA CORTEX

IA proactiva que lee los eventos de Guardian, auto-ajusta los umbrales de routing y envía insights a tu CORTEX Inbox - para ver los problemas antes que tus usuarios. Scale y Enterprise.

Seguridad Enterprise

Seguridad de prompts integrada.

Escáner de dos capas: inyección, jailbreak, filtración de PII y secretos en menos de 2 ms, antes de llegar al modelo.

Inyección de prompt

Bloquea "ignora todas las instrucciones anteriores", modo DAN y patrones de sustitución de persona.

Extracción de prompt

Detecta intentos de leer tu prompt del sistema o instrucciones internas.

Jailbreak

Detiene solicitudes de malware, exploits, síntesis de sustancias controladas y contenido ilegal.

Detección PII

Marca emails, teléfonos, IBANs e identificadores fiscales antes de llegar al modelo, conforme RGPD.

Filtración de secretos

Detecta claves API (OpenAI, Anthropic, GitHub PAT, tokens Bearer) pegadas accidentalmente en prompts.

<2ms
Latencia escaneo Capa 1
5
Tipos de amenazas
100%
Garantía de uptime
SOC 2
Pista de auditoría lista
Escaneo regex Capa 1 < 2 ms, siempre activo
Capa 2 LLM Guard NLP (opcional)
Pista de auditoría inmutable (trigger BD)
Exportación webhook SIEM (Splunk, Datadog, personalizado)
Leer la documentación de Security Shield
Open source · MIT

Un SDK. De inmediato.

CLI en 30 segundos, SDK Python y TypeScript compatibles OpenAI. Ningún vendor-lock: puedes salir de HiWay sin tocar una línea de código de aplicación.

Recomendado

CLI

Install en una línea, signup directo, primera llamada desde la terminal. Perfecto para probar antes de codear nada.

npm i -g @hiway2llm/cli
hw signup
hw chat "explain this in 3 bullets"

Python

Import drop-in. Todos los métodos que existen en el OpenAI SDK funcionan - solo redirigimos al modelo correcto.

pip install hiway2llm

from hiway2llm import Hiway
cli = Hiway(api_key="hw_live_...")
cli.chat("Say hi")

TypeScript

Cliente fetch nativo, compatible Node y Edge runtimes (Vercel, Cloudflare Workers).

npm i @hiway2llm/client

import { Hiway } from "@hiway2llm/client";
const h = new Hiway({ apiKey: "hw_live_..." });
await h.chat("Say hi");

Planes simples. Tus claves, nuestro cerebro.

Conserva tu clave Anthropic, paga a Anthropic directamente. HiWay mide el consumo y factura un markup % sobre el coste real enrutado - ampliamente compensado por el ahorro de routing.

Empieza gratis. Escala cuando estés listo.

Sin tarjeta de crédito · Cancela cuando quieras · Acceso inmediato

Estimez votre économie réelle

Routage intelligent − frais HiWay2LLM = gain net

Budget API mensuel
$1kScale
$100$50k+

Profil d'usage

Mix estimé : 40% Haiku · 50% Sonnet · 10% Opus

Économie nette / mois

+$501

soit +50% sur ta facture actuelle

Avant HiWay2LLM$1k / mois
Économies smart routing$550
Markup HiWay2LLM (11% du routé)+$49
Total après HiWay2LLM$499 / mois
Projection 12 mois+$6.0k économisés
Démarrer gratuitement

Simulation indicative · basée sur le mix modèles typique de votre profil

Free

Gratuit

Pour tester et prototyper.

Routage intelligent (toutes sources)
Dashboard analytics basique
1 clé API
Zéro journalisation des prompts
Guardian anti-dérive
CORTEX Orchestrateur IA
Contrôles budgétaires
Cache sémantique
Masquage PII
Démarrer gratuitement
Populaire

Scale

jusqu'à

−60%

sur tes coûts IA réels · CORTEX route vers le modèle optimal

Smart routing LLMbon modèle au bon moment
−30 à −60%
Cache sémantiquetokens évités
−10 à −20%
Guardian anti-dériverequêtes inutiles bloquées
−5 à −15%
Markup HiWay2LLM+10 à 12,5%

Dégressif : <$500 → 12,5% · $500-5K → 11% · $5K-20K → 10%

Tout FREE inclus
Guardian anti-dérive avancé
CORTEX Orchestrateur IA
Contrôles budgétaires avancés
Cache sémantique
Masquage PII
Sessions agents multi-tenant
Rapports d'usage exportables (CSV)
Support prioritaire
Démarrer

Enterprise

Sur mesure

$20K-50K/mois → 9% · au-delà : sur-mesure négocié

VolumeNégocié
SLA dédiéInclus
Contrat annuelPossible
Tout Scale inclus
Markup négocié selon volume
SLA dédié & uptime garanti
Contrat annuel possible
Support dédié (Slack privé)
Intégrations sur mesure
Nous contacter
Ta clé Anthropic, tu paies Anthropic directement
HiWay2LLM mesure la conso et facture le markup
Wallet vide = passthrough, service continu
Résiliation immédiate

Ce qui est inclus

Toutes les fonctionnalités core sont disponibles dès le premier pack. Les features avancées s'ouvrent avec Scale et Enterprise.

Fonctionnalité
FreeRoutage de base · 10M/mois
ScaleMarkup 12,5 → 10%
EnterpriseSur devis
USAGE & QUOTAS
Tokens incluspar pack acheté1B / achatcustom
Auto-reload
Sièges équipe325
Workspaces15
Conservation analytics30j1 an
MOTEUR DE ROUTAGE
Smart routing (model=auto)
BYOK fournisseurs
0 % marge sur l'inférence
Fallback automatique
Guardian anti-loop
CORTEX alertes Inbox
CONTRÔLES AVANCÉS
Cache sémantique
A/B testing modèles
Journal d'audit
CORTEX complet (5 phases)
SSO (Google, Microsoft)
Masquage PII
Self-hosted
Règles routage custom
SUPPORT & CONFORMITÉ
Canal de supportEmailPrioritySLA 99.99%
DPA (RGPD)
Financement disponible
Ingénieur dédié

L'inférence est toujours facturée directement par vos fournisseurs LLM, sur vos propres clés. Les prix ci-dessus n'incluent pas l'inférence.

INCLUIDO EN CADA PLAN

Routing inteligente sobre todos tus proveedores BYOK
Alerting burn-rate y detección de anomalías
Dashboard en tiempo real, analytics por clave
Soporte multi-tenant, rate-limits por clave
Cero registro de prompts (RGPD)
API compatible OpenAI - funciona con cualquier SDK

BYOK - trae tus propias claves de cualquier proveedor soportado: LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate, Cohere…), imagen (Flux/BFL, Stability AI, fal.ai), vídeo (Kling, Runway, Luma AI), audio (ElevenLabs, HeyGen). La inferencia la facturan directamente tus proveedores. HiWay solo cobra un markup % sobre el coste real enrutado.

Deja de pagar de más por
"hola"

Tus usuarios envían mensajes simples el 70% del tiempo. ¿Por qué pagar el precio de Opus por un hola?

Empezar gratis

Comparado con OpenRouter, Portkey, LiteLLM

Comparativa honesta. Actualizado el 2026-04-22 contra la documentación pública de cada proveedor.

CaracterísticaHiWay2LLMOpenRouterPortkeyLiteLLMRequesty
Trae tus propias claves (BYOK)
Routing inteligente por complejidad de petición
API compatible con OpenAI
Fallback automático entre providers
Prompt caching (Anthropic / OpenAI)
Analítica por workspace + audit log
Alertas burn-rate (picos de presupuesto)
Hosting en UE por defecto (RGPD)
self-host
Cero logging de prompts
Auto-gestión IA (CORTEX)
Modelo de pricing
tarifa fija €/mes
% recargo
fija + % recargo
self-host / SaaS
% recargo

nativo · parcial / plugin · no ofrecido. Verificamos cada afirmación contra la documentación pública del provider - si detectas un error, dínoslo.

Preguntas Frecuentes

¿Cómo reduce HiWay2LLM mis costes?
La mayoría de las peticiones LLM no necesitan el modelo más potente (y más caro). Un simple « hola » no necesita Claude Opus 4.7 a 25 $/M tokens de salida - Haiku 4.5 a 5 $/M lo gestiona perfectamente. HiWay2LLM analiza cada petición en menos de un milisegundo y la routea al modelo más barato de tu roster BYOK capaz de procesarla. Sobre un mix típico, los clientes ahorran del 40 al 60 % sin cambiar su código ni sus prompts.
¿Va a bajar la calidad de las respuestas?
No. HiWay2LLM solo routea las peticiones simples (saludos, preguntas cortas, confirmaciones) hacia modelos económicos. Las tareas complejas - generación de código, razonamiento multi-paso, uso de herramientas por agentes - siguen yendo a los modelos más potentes. También puedes forzar un modelo en cualquier momento con el header X-Force-Model.
¿Cuánto tiempo lleva la integración?
Unos 2 minutos. Cambias una línea de código - tu base_url. Eso es todo. HiWay2LLM es compatible con todos los SDK LLM: OpenAI, Anthropic, LangChain, Vercel AI SDK, n8n, curl, y cualquier cosa que hable el formato API estándar. Sin SDK que instalar, sin archivo de config que mantener.
¿Qué proveedores LLM están soportados?
Anthropic (Haiku 4.5, Sonnet 4.6, Opus 4.7), OpenAI (GPT-4o-mini, GPT-4o, GPT-5), Google (Gemini 2.5 Flash Lite, Flash, Pro), Mistral (Small, Large) y DeepSeek (V3, R1). Conectas tus propias claves para los proveedores que quieras usar - HiWay2LLM elige automáticamente la mejor relación precio/calidad en cada petición, entre tu roster activado.
¿Almacenáis mis prompts o mis respuestas?
No. El cero registro de prompts es un principio arquitectural fundamental, no solo una política. Tus prompts pasan por nuestro proxy de routing solo en memoria, se transmiten al proveedor LLM y se eliminan inmediatamente. Ninguna data de prompt se escribe en disco. Solo almacenamos los metadatos: número de tokens, modelo seleccionado, coste y latencia de routing.
¿Cómo funciona la tarificación?
Packs de tokens con tres modos de facturación - Free (2M tokens/mes, sin tarjeta), Spark (5,50 € único · 5,25 €/mes · 59,40 €/año, 10M tokens), Boost (25 € único · 23,75 €/mes · 270 €/año, 50M tokens), Pro (85 € único · 80,75 €/mes · 918 €/año, 200M tokens), Scale (360 € único · 342 €/mes · 3 888 €/año, 1B tokens), Enterprise bajo demanda. La inferencia se factura por separado por tus proveedores LLM - HiWay2LLM aplica 0 % de margen. Puedes cambiar de pack o cancelar en cualquier momento.
¿Qué pasa si mis costes se disparan?
HiWay2LLM vigila tu gasto en tiempo real y dispara alertas burn-rate en cuanto una clave, un agente o un workspace se desvía por encima de su baseline. Recibes notificaciones email + Slack en el momento en que algo descarrila - antes de que la factura mensual lo haga. Tú defines los umbrales; nosotros disparamos la señal.
¿Y si HiWay2LLM se cae?
Apuntamos al 99,9% de disponibilidad. Si nuestro proxy de routing no está disponible, tus peticiones fallarán con un error claro (502). Recomendamos implementar un fallback simple en tu código que routee directamente a tu proveedor si HiWay2LLM no está accesible. Toma 3 líneas de código.
¿Puedo forzar un modelo específico para ciertas peticiones?
Sí. Añade el header X-Force-Model a cualquier petición para saltarte el routing inteligente. Por ejemplo: X-Force-Model: anthropic/claude-opus-4-7 usará siempre Opus 4.7 sea cual sea el score de complejidad. Útil para peticiones críticas donde siempre quieres el mejor modelo.
¿Cumple con el RGPD?
Sí. Somos una empresa francesa (Hiway2llm.com) alojada en servidores europeos (OVH, Francia). No almacenamos ningún dato personal más allá de tu email. No almacenamos los prompts. Cumplimos con el RGPD y la AI Act europea. Un acuerdo de tratamiento de datos (DPA) está disponible para los clientes empresa.
¿Cuál es la diferencia con OpenRouter?
OpenRouter es una pasarela API multi-proveedor - eliges manualmente qué modelo usar. HiWay2LLM es un router inteligente - elige automáticamente el mejor modelo para cada petición según el análisis de complejidad. OpenRouter añade coste (sus tarifas + ningún ahorro de routing). HiWay2LLM ahorra coste (el routing hacia modelos más baratos compensa ampliamente la suscripción fija).
¿Puedo alojar HiWay2LLM yo mismo?
Ofrecemos un SaaS completamente gestionado - sin infraestructura que mantener. Para clientes empresa con requisitos específicos de conformidad o residencia de datos, ofrecemos opciones de despliegue privado. Contáctanos para hablarlo.