Les systemes IA echouent. Un modele peut etre temporairement indisponible, une API peut atteindre sa limite de requetes, un outil peut retourner une erreur inattendue.

Le systeme de retry et failover gere automatiquement ces situations. Quand une action echoue, le systeme evalue la nature de l'erreur et applique la strategie appropriee : reessai avec backoff exponentiel, basculement vers un modele alternatif, ou degradation gracieuse.

Tout cela se produit de maniere transparente. L'utilisateur ne voit pas les retentatives ni les basculements. Il recoit son resultat, peut-etre avec un delai legerement plus long, mais sans interruption.

1

Detection

Chaque appel (modele, outil, API) est encapsule dans un circuit breaker qui detecte les erreurs et les timeouts.

2

Classification

L'erreur est classifiee : temporaire (rate limit, timeout reseau), permanente (endpoint supprime, acces refuse), ou inconnue.

3

Strategie de retry

Pour les erreurs temporaires : reessai avec backoff exponentiel (1s, 2s, 4s...) et nombre de tentatives configurable.

4

Failover

Pour les erreurs permanentes : basculement vers le provider/modele alternatif configure. Le contexte est transfere.

5

Degradation gracieuse

Si toutes les alternatives echouent : l'agent informe l'utilisateur clairement et propose des alternatives manuelles.

Rate limiting

Le modele principal atteint sa limite de requetes. Le systeme bascule automatiquement sur le modele secondaire. L'utilisateur ne remarque rien.

Panne de provider

Un provider d'API est en maintenance. Le failover active le provider alternatif. Les requetes en cours sont rejouees sans perte de contexte.

Outil defaillant

Un outil externe retourne des erreurs intermittentes. Le circuit breaker le desactive temporairement et l'agent utilise une methode alternative.

featurePages.retryFailover.config
  • Actif par defaut sur tous les agents EasyClaw v2
  • Les providers et modeles de fallback sont configurables
  • Compatible avec tous les modeles et outils supportes par EasyClaw
Resilience et failover -- EasyClaw v2