Guardian - système anti-boucle
Règles par workspace pour bloquer les agents runaway, le trafic dupliqué et les pics de coût.
Guardian est le filet de sécurité toujours actif de HiWay. Il surveille chaque requête en quasi-temps-réel et bloque les modes de défaillance qui ruinent les charges de travail agent-heavy : boucles runaway, requêtes dupliquées, pics de coût, context bloat, agents zombies et abus de rate limit. Chaque règle est éditable par workspace dans Tableau de bord → Guardian.
Les règles
| Règle | Trigger | Action par défaut |
|---|---|---|
| Dedup | Même hash de prompt, même clé, 3+ fois en 60s | Bloque la 4e, alerte |
| Pic de coût | 10× votre moyenne glissante 24h en moins de 5 minutes | Throttle à 1 req/s, alerte |
| Context bloat | Tokens de prompt > plafond configurable (défaut 50k) | Rejet en 413 |
| Agent zombie | Même clé boucle 30+ minutes sans variation de sortie | Suspend la clé, alerte |
| Rate limit | RPM par clé dépassé | Renvoie 429 avec Retry-After |
Guardian tourne avant le routage
Les blocs Guardian se produisent avant que la requête touche un fournisseur, donc les requêtes bloquées ne comptent pas dans votre quota mensuel et n'engendrent pas de coût BYOK upstream.
À quoi ressemble un blocage
json
{
"error": {
"code": "guardian_block",
"message": "Bloqué par Guardian: dedup (3 prompts identiques en 47s)",
"rule": "dedup",
"retry_after_seconds": 60
}
}