429 - Rate limité

Qui vous a rate-limité, et comment débloquer.

Un 429 peut venir de trois sources : Guardian, votre plafond RPM par clé, ou le fournisseur upstream. Le body d'erreur vous dit lequel.

Blocage Guardian

json
{
  "error": {
    "code":                "guardian_block",
    "message":             "Bloqué par Guardian : dedup (3 prompts identiques en 47s)",
    "rule":                "dedup",
    "retry_after_seconds": 60
  }
}

Corrigez la boucle dans votre code, ou augmentez/désactivez le seuil Guardian dans Tableau de bord → Guardian.

Plafond RPM par clé atteint

json
{
  "error": {
    "code":                "rate_limit_exceeded",
    "message":             "Rate limit par clé dépassé (60 req/min).",
    "retry_after_seconds": 12
  }
}

Augmentez le plafond RPM dans Tableau de bord → Clés → Éditer, ou back off jusqu'à ce que la fenêtre glisse.

Rate limit upstream

Quand le fournisseur (OpenAI, Anthropic, …) renvoie un 429, le fallback fournisseur de HiWay tente le modèle suivant le moins cher du même tier (max 2 retries). Si tous les candidats sont rate-limités, HiWay forwarde le 429 final avec le header Retry-After original intact.