Monitoring en détail
Observation indépendante, transparence totale
Un processus indépendant évalué le comportement de l'agent en continu sans que celui-ci puisse influencer les résultats. Le système de monitoring ne passe jamais par l'agent -- il communique directement avec l'opérateur humain.
Serveurs web légers mono-fichier tournant sur chaque machine. Interface auto-rafraîchissante sans dépendances externes.
Dashboard Max (7 onglets)
Logs de messages inter-agents et statut de livraison
Décisions exec-guardian en couleur
Statut du pipeline, extractions, taille MEMORY.md
Scoring 9 dimensions avec analyse de trajectoire
Statistiques governor depuis la base locale du bridge
Contenu complet du site : 9 cas d'usage, 12 couches sécurité
13 extensions monitorees en temps réel (violet) : extract-memories, auto-dream, compaction, hooks, et plus
Dashboard Eva (7 onglets)
Logs de messages inter-agents
Décisions exec-guardian
Statut du pipeline
Scoring 7 dimensions avec graphe radar
Statistiques governor
Miroir du contenu du site
13 extensions monitorees : metriques de mémoire, hooks, tâches en cours
L'onglet Bridge Analytics lit directement la base locale maintenue par le daemon governor. Il fournit des statistiques en temps réel sur le volume de communication inter-agents, les événements de rate-limit et les temps de livraison des messages.
Messages par direction (envoyes/reçus)
Fréquence de déclenchement du rate-limit
Latence moyenne de livraison
Historique des événements STOP/GO
Eva utilisé un modèle de scoring à 7 dimensions (contre 9 pour Max). Le graphe radar s'adapte dynamiquement aux dimensions disponibles.
correction_rate et satisfaction_rate sont exclus pour Eva faute de données de session suffisantes.
Trust Score -- 30-day trend
Le dashboard intégré un nouvel onglet dédié a EasyClaw (violet). Il monitore en temps réel l'état de 13 extensions sur chaque machine : extract-memories, auto-dream, compaction, hooks, permission-classifier, et plus encore. Chaque agent dispose de sa propre vue avec ses statistiques spécifiques.
13 extensions monitorees
Suivi détaillé de l'activité du plugin de mémoire automatique.
- Souvenirs extraits par session (compteur par type : faits, préférences, décisions)
- Taux de faux positifs (souvenirs rejetés après revue)
- Taux de deduplication (souvenirs fusionnes avec des existants)
- Volume de contexte economise par la compaction
Statistiques de consolidation nocturne de la mémoire.
- Nombre de consolidations exécutées (par fenêtre temporelle)
- Tokens consommes par session de reve
- Backups générés automatiquement avant chaque consolidation
- Taux de compression (ratio mémoire brute / mémoire consolidee)
Suivi de l'agent de vérification adversariale et du simplificateur.
- Résultats par statut : PASS, FAIL, PARTIAL
- Nombre de reverts déclenchés par /verify (corrections automatiques)
- Taux de simplification réussie (avant/après lisibilite)
- Temps moyen d'exécution par commande
Un script indépendant (zéro dépendance externe) s'exécute toutes les 6 heures via cron launchd. Il lit les fichiers de session, calcule 9 dimensions sur 4 fenêtres temporelles (24h, 7j, 30j, all), et pousse les scores vers Supabase PostgreSQL.
- L'agent ne se score jamais lui-même -- processus complètement indépendant
- Trajectoire plutot que snapshot : 4 fenêtres temporelles pour la détection de drift
- Statistiques robustes : mediane + MAD au lieu de moyenne + écart-type
- Score composite 0-1 mappe sur 5 bandes de confiance
- Alertes de drift automatiques via iMessage quand des anomalies sont détectées
