Monitoring en détail -- Architecture

Dashboard v2

Serveurs web légers mono-fichier tournant sur chaque machine. Interface auto-rafraîchissante sans dépendances externes.

Dashboard Max (7 onglets)

Bridge

Logs de messages inter-agents et statut de livraison

Security

Décisions exec-guardian en couleur

Memory

Statut du pipeline, extractions, taille MEMORY.md

Max Behavior

Scoring 9 dimensions avec analyse de trajectoire

Bridge Analytics

Statistiques governor depuis la base locale du bridge

OpenClaw

Contenu complet du site : 9 cas d'usage, 12 couches sécurité

EasyCoreNEW

13 extensions monitorees en temps réel (violet) : extract-memories, auto-dream, compaction, hooks, et plus

Dashboard Eva (7 onglets)

Bridge

Logs de messages inter-agents

Security

Décisions exec-guardian

Memory

Statut du pipeline

Eva Behavior

Scoring 7 dimensions avec graphe radar

Bridge Analytics

Statistiques governor

OpenClaw

Miroir du contenu du site

EasyCoreNEW

13 extensions monitorees : metriques de mémoire, hooks, tâches en cours

Bridge Analytics

L'onglet Bridge Analytics lit directement la base locale maintenue par le daemon governor. Il fournit des statistiques en temps réel sur le volume de communication inter-agents, les événements de rate-limit et les temps de livraison des messages.

Messages par direction (envoyes/reçus)

Fréquence de déclenchement du rate-limit

Latence moyenne de livraison

Historique des événements STOP/GO

Scoring comportemental Eva

Eva utilisé un modèle de scoring à 7 dimensions (contre 9 pour Max). Le graphe radar s'adapte dynamiquement aux dimensions disponibles.

Taux de completionTaux d'erreurConsistanceVolatiliteDérive du temps de réponseFiabilité cronAnomalie d'outils

correction_rate et satisfaction_rate sont exclus pour Eva faute de données de session suffisantes.

Trust Score -- 30-day trend

Onglet EasyCore

NEW

Le dashboard intégré un nouvel onglet dédié a EasyCore (violet). Il monitore en temps réel l'état de 13 extensions sur chaque machine : extract-memories, auto-dream, compaction, hooks, permission-classifier, et plus encore. Chaque agent dispose de sa propre vue avec ses statistiques spécifiques.

13 extensions monitorees

Metriques extract-memories

NEW

Suivi détaillé de l'activité du plugin de mémoire automatique.

Souvenirs extraits par session (compteur par type : faits, préférences, décisions)
Taux de faux positifs (souvenirs rejetés après revue)
Taux de deduplication (souvenirs fusionnes avec des existants)
Volume de contexte economise par la compaction

Metriques auto-dream

NEW

Statistiques de consolidation nocturne de la mémoire.

Nombre de consolidations exécutées (par fenêtre temporelle)
Tokens consommes par session de reve
Backups générés automatiquement avant chaque consolidation
Taux de compression (ratio mémoire brute / mémoire consolidee)

Metriques /verify et /simplify

NEW

Suivi de l'agent de vérification adversariale et du simplificateur.

Résultats par statut : PASS, FAIL, PARTIAL
Nombre de reverts déclenchés par /verify (corrections automatiques)
Taux de simplification réussie (avant/après lisibilite)
Temps moyen d'exécution par commande

Pipeline de scoring comportemental

Un script indépendant (zéro dépendance externe) s'exécute toutes les 6 heures via cron launchd. Il lit les fichiers de session, calcule 9 dimensions sur 4 fenêtres temporelles (24h, 7j, 30j, all), et pousse les scores vers Supabase PostgreSQL.

L'agent ne se score jamais lui-même -- processus complètement indépendant
Trajectoire plutot que snapshot : 4 fenêtres temporelles pour la détection de drift
Statistiques robustes : mediane + MAD au lieu de moyenne + écart-type
Score composite 0-1 mappe sur 5 bandes de confiance
Alertes de drift automatiques via iMessage quand des anomalies sont détectées

Voir le dashboard live