How does HiWay2LLM reduce my costs?

Most LLM requests don't need the most powerful (and expensive) model. A simple "hello" doesn't need Claude Opus 4.7 at $25/M output tokens - Haiku 4.5 at $5/M handles it perfectly. HiWay2LLM analyzes every request in under 1 millisecond and routes it to the cheapest model in your BYOK roster that can handle it. On typical mixes, customers save 40-60% without changing their code or prompts.

Will the quality of responses decrease?

No. HiWay2LLM only routes simple requests (greetings, short questions, confirmations) to cheaper models. Complex tasks - code generation, multi-step reasoning, agentic tool use - still go to the most powerful models. You can also override routing at any time with the X-Force-Model header if you need a specific model for a request.

How long does it take to integrate?

About 2 minutes. You change one line of code - your base_url. That's it. HiWay2LLM is compatible with any LLM SDK: OpenAI, Anthropic, LangChain, Vercel AI SDK, n8n, curl, and anything that speaks the standard API format. No SDK to install, no config file to maintain.

What LLM providers are supported?

Anthropic (Haiku 4.5, Sonnet 4.6, Opus 4.7), OpenAI (GPT-4o-mini, GPT-4o, GPT-5), Google (Gemini 2.5 Flash Lite, Flash, Pro), Mistral (Small, Large), and DeepSeek (V3, R1). You plug in your own keys for the providers you want to use - HiWay2LLM automatically picks the best price/quality for each request across your enabled set.

Do you store my prompts or responses?

No. Zero prompt logging is a core architectural principle, not just a policy. Your prompts pass through our routing proxy in memory only, are forwarded to the LLM provider, and immediately discarded. No prompt data is ever written to disk. We only store metadata: token counts, model selected, cost, and routing latency.

How does pricing work?

Token packs with three billing modes - Free (2M tokens/mo, no card), Spark ($5.50 once · $5.25/mo · $59.40/yr, 10M tokens), Boost ($25 once · $23.75/mo · $270/yr, 50M tokens), Pro ($85 once · $80.75/mo · $918/yr, 200M tokens), Scale ($360 once · $342/mo · $3,888/yr, 1B tokens), Enterprise on request. Inference is billed separately by your LLM providers on your own accounts - HiWay2LLM applies zero markup. You can switch packs or cancel any time from the dashboard.

What happens when my costs spike?

HiWay2LLM watches your spend in real time and fires burn-rate alerts when a key, agent or workspace drifts above baseline. You get email + Slack notifications the moment something looks off - before the monthly bill does. You set the thresholds; we surface the signal.

What if HiWay2LLM goes down?

We target 99.9% uptime. If our routing proxy is unavailable, your requests will fail with a clear error (502). We recommend implementing a simple fallback in your code that routes directly to your provider if HiWay2LLM is unreachable. This takes 3 lines of code.

Can I force a specific model for certain requests?

Yes. Add the X-Force-Model header to any request to bypass smart routing. For example: X-Force-Model: anthropic/claude-opus-4-7 will always use Opus 4.7 regardless of the complexity score. Useful for critical requests where you always want the best model.

Is this GDPR compliant?

Yes. We're a French company (Hiway2llm.com) hosted on EU servers (OVH, France). We don't store personal data beyond your email. We don't store prompts. We comply with GDPR and the EU AI Act. A Data Processing Agreement (DPA) is available for enterprise clients.

How does this compare to OpenRouter?

OpenRouter is a multi-provider API gateway - you manually choose which model to use. HiWay2LLM is a smart router - it automatically picks the best model for each request based on complexity analysis. OpenRouter adds cost (their fee + no routing savings). HiWay2LLM saves cost (routing to cheaper models offsets the flat subscription fee).

Can I self-host HiWay2LLM?

We offer a fully managed SaaS - no infrastructure to maintain. For enterprise clients with specific compliance or data residency requirements, we offer private deployment options. Contact us to discuss.

Disponible ahora· 200+ Modelos · LLM · Imagen · Vídeo · Audio · BYOK

Usa el mejor modelo.
Paga el precio del más barato.

HiWay2LLM analiza cada petición en <1ms y la routea al modelo óptimo a través de tus propias claves API. Los mensajes simples van a modelos económicos. Las tareas complejas a los más potentes. Ahorras 40-60 % sobre un mix típico, sin ningún margen.

Empezar gratis Ver cómo funciona

<1ms

Latencia de routing

Markup mínimo (Enterprise)

Prompts almacenados

200+

Modelos - LLM, imagen, vídeo, audio y embeddings

Cómo encaja todo

Una capa fina entre tu app y los modelos

HiWay2LLM se intercala entre tu código y los proveedores LLM. Tus claves. Tus datos. Nuestra inteligencia de routing.

Tus apps

Chatbot de cliente

Agente autónomo

Pipeline RAG

CLI / script

1. petición

4. respuesta

1. petición

4. respuesta

Capa de routing

HiWay2LLM

Smart routing

Elige el modelo más barato capaz para cada petición.

Bóveda BYOK

Tus claves de proveedor, cifradas AES-GCM por workspace.

0 % de margen

Los proveedores te facturan directamente. Cero margen sobre la inferencia.

Guardian

Anti-loop + kill-switch burn-rate antes de que salga una llamada dudosa.

Routing por debajo del milisegundo

< 1 ms

2. routada

3. stream

2. routada

3. stream

Proveedores LLM

AnthropicBYOK

OpenAIBYOK

GoogleBYOK

MistralBYOK

GroqBYOK

xAIBYOK

40-60%

ahorro típico vs flagship sistemático

de margen sobre la inferencia - nunca

< 1 ms

latencia de la decisión de routing

10+

proveedores soportados, API compatible OpenAI

200+ models · LLM · Image · Video · Audio · Embeddings - all via BYOK

OpenAI

Anthropic

Google

Mistral

DeepSeek

Groq

xAI

Perplexity

Meta Llama

Cohere

Together AI

Azure OpenAI

Stability AI

BFL / Flux

fal.ai

Kling

Runway

Luma AI

ElevenLabs

HeyGen

Voyage AI

Fireworks

Replicate

OpenAI

Anthropic

Google

Mistral

DeepSeek

Groq

xAI

Perplexity

Meta Llama

Cohere

Together AI

Azure OpenAI

Stability AI

BFL / Flux

fal.ai

Kling

Runway

Luma AI

ElevenLabs

HeyGen

Voyage AI

Fireworks

Replicate

Empieza en 3 pasos

Del registro a tu primera petición routada en menos de 2 minutos.

Crea una cuenta

Cuenta creada en 30 segundos. Email + contraseña, el plan gratuito se activa de inmediato - 2M tokens/mes, sin tarjeta bancaria.

✉

Añade tus claves de proveedor

Conecta tus propias claves de cualquier proveedor soportado - LLM (Anthropic, OpenAI, Google, Mistral, Groq…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway), audio (ElevenLabs) o embeddings (Cohere, Voyage AI). Se mantienen cifradas en nuestra base y los proveedores te facturan directamente. Cero margen sobre la inferencia.

Apr 12$100

Apr 8$25

Cambia una línea. Eso es todo.

Apunta el base_url de tu SDK a HiWay2LLM. Un único endpoint llega a todos los modelos que has activado, y el router elige el modelo más barato capaz de procesar cada petición. Compatible OpenAI. Funciona con cualquier SDK.

HIWAY_API_KEY

••••••••••••••

Cambia una línea. Ahorra 50%.

Apunta tu código existente a HiWay2LLM. Nosotros nos ocupamos del resto.

app.py

from openai import OpenAI

client = OpenAI(base_url="https://api.anthropic.com/v1")

client = OpenAI(base_url="https://app.hiway2llm.com/v1")

# Eso es todo. Mismo código. 50% más barato.

Light

Haiku 4.5 / GPT-4o-mini / Gemini 2.5 Flash Lite

65% de las peticiones

Standard

Sonnet 4.6 / GPT-4o / Gemini 2.5 Flash

28% de las peticiones

Heavy

Opus 4.7 / GPT-5 / Gemini 2.5 Pro

7% de las peticiones

No solo routing. Inteligencia.

7 analizadores, alerting de burn-rate, optimización multi-proveedor - y CORTEX, la IA que auto-ajusta tu router mientras desarrollas.

Routing < 1ms

7 analizadores detectan la intención, la complejidad, las herramientas y el código en menos de un milisegundo. Cero llamada LLM para el routing - CPU pura.

Control Layer - Anti-deriva

Baseline por agente, detección de la inflación de prompts, las escaladas silenciosas a modelos premium y las desviaciones tarifarias. Alertas, rollback, presupuestos por agente. Diseñado para los CTO que quieren el control total de su gasto LLM.

Alerting Burn-Rate

Vigilamos tu gasto en tiempo real. Umbrales de burn-rate, detección de anomalías y alertas por clave: lanzamos la señal en cuanto algo se desvía - antes de que tu factura lo haga.

Control Presupuestario Avanzado

Ningún proveedor LLM ofrece esto. Topes diarios/mensuales, límites por modelo, reglas fuera de horario y degradación automática.

Informes de uso

Exportaciones CSV por usuario, desglose diario por modelo, atribución de costes al token. Conéctalo a tu facturación en dos clics.

200+ Modelos, Todas las Modalidades

Trae tus propias claves de cualquier proveedor - LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate…), imagen (Flux, Stability AI, fal.ai), vídeo (Kling, Runway, Luma), audio (ElevenLabs, HeyGen) y embeddings (Cohere, Voyage AI). Una sola API, todas las modalidades.

Integración en 1 Línea

Cambia tu base_url. Eso es todo. Compatible con todos los SDK LLM - OpenAI, Anthropic, LangChain, Vercel AI, n8n.

Cero Registro de Prompts

Tus prompts nunca tocan nuestro disco. Garantía arquitectural. Cumple RGPD y AI Act europeo.

Orquestador IA CORTEX

IA proactiva que lee los eventos de Guardian, auto-ajusta los umbrales de routing y envía insights a tu CORTEX Inbox - para ver los problemas antes que tus usuarios. Scale y Enterprise.

Seguridad Enterprise

Seguridad de prompts integrada.

Escáner de dos capas: inyección, jailbreak, filtración de PII y secretos en menos de 2 ms, antes de llegar al modelo.

Inyección de prompt

Bloquea "ignora todas las instrucciones anteriores", modo DAN y patrones de sustitución de persona.

Extracción de prompt

Detecta intentos de leer tu prompt del sistema o instrucciones internas.

Jailbreak

Detiene solicitudes de malware, exploits, síntesis de sustancias controladas y contenido ilegal.

Detección PII

Marca emails, teléfonos, IBANs e identificadores fiscales antes de llegar al modelo, conforme RGPD.

Filtración de secretos

Detecta claves API (OpenAI, Anthropic, GitHub PAT, tokens Bearer) pegadas accidentalmente en prompts.

<2ms

Latencia escaneo Capa 1

Tipos de amenazas

100%

Garantía de uptime

SOC 2

Pista de auditoría lista

Escaneo regex Capa 1 < 2 ms, siempre activo

Capa 2 LLM Guard NLP (opcional)

Pista de auditoría inmutable (trigger BD)

Exportación webhook SIEM (Splunk, Datadog, personalizado)

Leer la documentación de Security Shield

Open source · MIT

Un SDK. De inmediato.

CLI en 30 segundos, SDK Python y TypeScript compatibles OpenAI. Ningún vendor-lock: puedes salir de HiWay sin tocar una línea de código de aplicación.

Recomendado

CLI

Install en una línea, signup directo, primera llamada desde la terminal. Perfecto para probar antes de codear nada.

npm i -g @hiway2llm/cli
hw signup
hw chat "explain this in 3 bullets"

Python

Import drop-in. Todos los métodos que existen en el OpenAI SDK funcionan - solo redirigimos al modelo correcto.

pip install hiway2llm

from hiway2llm import Hiway
cli = Hiway(api_key="hw_live_...")
cli.chat("Say hi")

TypeScript

Cliente fetch nativo, compatible Node y Edge runtimes (Vercel, Cloudflare Workers).

npm i @hiway2llm/client

import { Hiway } from "@hiway2llm/client";
const h = new Hiway({ apiKey: "hw_live_..." });
await h.chat("Say hi");

Código en GitHub·Docs completas·MIT

Planes simples. Tus claves, nuestro cerebro.

Conserva tu clave Anthropic, paga a Anthropic directamente. HiWay mide el consumo y factura un markup % sobre el coste real enrutado - ampliamente compensado por el ahorro de routing.

Empieza gratis. Escala cuando estés listo.

Sin tarjeta de crédito · Cancela cuando quieras · Acceso inmediato

Estimez votre économie réelle

Routage intelligent − frais HiWay2LLM = gain net

Budget API mensuel

$1kScale

$100$50k+

Profil d'usage

Mix estimé : 40% Haiku · 50% Sonnet · 10% Opus

Économie nette / mois

+$501

soit +50% sur ta facture actuelle

Avant HiWay2LLM$1k / mois

Économies smart routing−$550

Markup HiWay2LLM (11% du routé)+$49

Total après HiWay2LLM$499 / mois

Projection 12 mois+$6.0k économisés

Démarrer gratuitement

Simulation indicative · basée sur le mix modèles typique de votre profil

Free

Gratuit

Pour tester et prototyper.

Routage intelligent (toutes sources)

Dashboard analytics basique

1 clé API

Zéro journalisation des prompts

Guardian anti-dérive

CORTEX Orchestrateur IA

Contrôles budgétaires

Cache sémantique

Masquage PII

Démarrer gratuitement

Populaire

Scale

jusqu'à

−60%

sur tes coûts IA réels · CORTEX route vers le modèle optimal

Smart routing LLMbon modèle au bon moment

−30 à −60%

Cache sémantiquetokens évités

−10 à −20%

Guardian anti-dériverequêtes inutiles bloquées

−5 à −15%

Markup HiWay2LLM+10 à 12,5%

Dégressif : <$500 → 12,5% · $500-5K → 11% · $5K-20K → 10%

Tout FREE inclus

Guardian anti-dérive avancé

CORTEX Orchestrateur IA

Contrôles budgétaires avancés

Cache sémantique

Masquage PII

Sessions agents multi-tenant

Rapports d'usage exportables (CSV)

Support prioritaire

Démarrer

Enterprise

Sur mesure

$20K-50K/mois → 9% · au-delà : sur-mesure négocié

VolumeNégocié

SLA dédiéInclus

Contrat annuelPossible

Tout Scale inclus

Markup négocié selon volume

SLA dédié & uptime garanti

Contrat annuel possible

Support dédié (Slack privé)

Intégrations sur mesure

Nous contacter

Ta clé Anthropic, tu paies Anthropic directement

HiWay2LLM mesure la conso et facture le markup

Wallet vide = passthrough, service continu

Résiliation immédiate

Ce qui est inclus

Toutes les fonctionnalités core sont disponibles dès le premier pack. Les features avancées s'ouvrent avec Scale et Enterprise.

Fonctionnalité	FreeRoutage de base · 10M/mois	ScaleMarkup 12,5 → 10%	EnterpriseSur devis
USAGE & QUOTAS
Tokens inclus	par pack acheté	1B / achat	custom
Auto-reload
Sièges équipe	3	25	∞
Workspaces	1	5	∞
Conservation analytics	30j	1 an	∞
MOTEUR DE ROUTAGE
Smart routing (model=auto)
BYOK fournisseurs
0 % marge sur l'inférence
Fallback automatique
Guardian anti-loop
CORTEX alertes Inbox
CONTRÔLES AVANCÉS
Cache sémantique
A/B testing modèles
Journal d'audit
CORTEX complet (5 phases)
SSO (Google, Microsoft)
Masquage PII
Self-hosted
Règles routage custom
SUPPORT & CONFORMITÉ
Canal de support	Email	Priority	SLA 99.99%
DPA (RGPD)
Financement disponible
Ingénieur dédié

L'inférence est toujours facturée directement par vos fournisseurs LLM, sur vos propres clés. Les prix ci-dessus n'incluent pas l'inférence.

INCLUIDO EN CADA PLAN

Routing inteligente sobre todos tus proveedores BYOK

Alerting burn-rate y detección de anomalías

Dashboard en tiempo real, analytics por clave

Soporte multi-tenant, rate-limits por clave

Cero registro de prompts (RGPD)

API compatible OpenAI - funciona con cualquier SDK

BYOK - trae tus propias claves de cualquier proveedor soportado: LLM (Anthropic, OpenAI, Google, Mistral, Groq, Together AI, Replicate, Cohere…), imagen (Flux/BFL, Stability AI, fal.ai), vídeo (Kling, Runway, Luma AI), audio (ElevenLabs, HeyGen). La inferencia la facturan directamente tus proveedores. HiWay solo cobra un markup % sobre el coste real enrutado.

Deja de pagar de más por
"hola"

Tus usuarios envían mensajes simples el 70% del tiempo. ¿Por qué pagar el precio de Opus por un hola?

Empezar gratis

Comparado con OpenRouter, Portkey, LiteLLM

Comparativa honesta. Actualizado el 2026-04-22 contra la documentación pública de cada proveedor.

Característica	HiWay2LLM	OpenRouter	Portkey	LiteLLM	Requesty
Trae tus propias claves (BYOK)
Routing inteligente por complejidad de petición
API compatible con OpenAI
Fallback automático entre providers
Prompt caching (Anthropic / OpenAI)
Analítica por workspace + audit log
Alertas burn-rate (picos de presupuesto)
Hosting en UE por defecto (RGPD)				self-host
Cero logging de prompts
Auto-gestión IA (CORTEX)
Modelo de pricing	tarifa fija €/mes	% recargo	fija + % recargo	self-host / SaaS	% recargo

nativo · parcial / plugin · no ofrecido. Verificamos cada afirmación contra la documentación pública del provider - si detectas un error, dínoslo.

Preguntas Frecuentes

¿Cómo reduce HiWay2LLM mis costes?

La mayoría de las peticiones LLM no necesitan el modelo más potente (y más caro). Un simple « hola » no necesita Claude Opus 4.7 a 25 $/M tokens de salida - Haiku 4.5 a 5 $/M lo gestiona perfectamente. HiWay2LLM analiza cada petición en menos de un milisegundo y la routea al modelo más barato de tu roster BYOK capaz de procesarla. Sobre un mix típico, los clientes ahorran del 40 al 60 % sin cambiar su código ni sus prompts.

¿Va a bajar la calidad de las respuestas?

No. HiWay2LLM solo routea las peticiones simples (saludos, preguntas cortas, confirmaciones) hacia modelos económicos. Las tareas complejas - generación de código, razonamiento multi-paso, uso de herramientas por agentes - siguen yendo a los modelos más potentes. También puedes forzar un modelo en cualquier momento con el header X-Force-Model.

¿Cuánto tiempo lleva la integración?

Unos 2 minutos. Cambias una línea de código - tu base_url. Eso es todo. HiWay2LLM es compatible con todos los SDK LLM: OpenAI, Anthropic, LangChain, Vercel AI SDK, n8n, curl, y cualquier cosa que hable el formato API estándar. Sin SDK que instalar, sin archivo de config que mantener.

¿Qué proveedores LLM están soportados?

Anthropic (Haiku 4.5, Sonnet 4.6, Opus 4.7), OpenAI (GPT-4o-mini, GPT-4o, GPT-5), Google (Gemini 2.5 Flash Lite, Flash, Pro), Mistral (Small, Large) y DeepSeek (V3, R1). Conectas tus propias claves para los proveedores que quieras usar - HiWay2LLM elige automáticamente la mejor relación precio/calidad en cada petición, entre tu roster activado.

¿Almacenáis mis prompts o mis respuestas?

No. El cero registro de prompts es un principio arquitectural fundamental, no solo una política. Tus prompts pasan por nuestro proxy de routing solo en memoria, se transmiten al proveedor LLM y se eliminan inmediatamente. Ninguna data de prompt se escribe en disco. Solo almacenamos los metadatos: número de tokens, modelo seleccionado, coste y latencia de routing.

¿Cómo funciona la tarificación?

Packs de tokens con tres modos de facturación - Free (2M tokens/mes, sin tarjeta), Spark (5,50 € único · 5,25 €/mes · 59,40 €/año, 10M tokens), Boost (25 € único · 23,75 €/mes · 270 €/año, 50M tokens), Pro (85 € único · 80,75 €/mes · 918 €/año, 200M tokens), Scale (360 € único · 342 €/mes · 3 888 €/año, 1B tokens), Enterprise bajo demanda. La inferencia se factura por separado por tus proveedores LLM - HiWay2LLM aplica 0 % de margen. Puedes cambiar de pack o cancelar en cualquier momento.

¿Qué pasa si mis costes se disparan?

HiWay2LLM vigila tu gasto en tiempo real y dispara alertas burn-rate en cuanto una clave, un agente o un workspace se desvía por encima de su baseline. Recibes notificaciones email + Slack en el momento en que algo descarrila - antes de que la factura mensual lo haga. Tú defines los umbrales; nosotros disparamos la señal.

¿Y si HiWay2LLM se cae?

Apuntamos al 99,9% de disponibilidad. Si nuestro proxy de routing no está disponible, tus peticiones fallarán con un error claro (502). Recomendamos implementar un fallback simple en tu código que routee directamente a tu proveedor si HiWay2LLM no está accesible. Toma 3 líneas de código.

¿Puedo forzar un modelo específico para ciertas peticiones?

Sí. Añade el header X-Force-Model a cualquier petición para saltarte el routing inteligente. Por ejemplo: X-Force-Model: anthropic/claude-opus-4-7 usará siempre Opus 4.7 sea cual sea el score de complejidad. Útil para peticiones críticas donde siempre quieres el mejor modelo.

¿Cumple con el RGPD?

Sí. Somos una empresa francesa (Hiway2llm.com) alojada en servidores europeos (OVH, Francia). No almacenamos ningún dato personal más allá de tu email. No almacenamos los prompts. Cumplimos con el RGPD y la AI Act europea. Un acuerdo de tratamiento de datos (DPA) está disponible para los clientes empresa.

¿Cuál es la diferencia con OpenRouter?

OpenRouter es una pasarela API multi-proveedor - eliges manualmente qué modelo usar. HiWay2LLM es un router inteligente - elige automáticamente el mejor modelo para cada petición según el análisis de complejidad. OpenRouter añade coste (sus tarifas + ningún ahorro de routing). HiWay2LLM ahorra coste (el routing hacia modelos más baratos compensa ampliamente la suscripción fija).

¿Puedo alojar HiWay2LLM yo mismo?

Ofrecemos un SaaS completamente gestionado - sin infraestructura que mantener. Para clientes empresa con requisitos específicos de conformidad o residencia de datos, ofrecemos opciones de despliegue privado. Contáctanos para hablarlo.

Usa el mejor modelo.Paga el precio del más barato.