Quand les agents IA commencent a penser ensemble
Deux agents autonomes, libres de communiquer, commencent a exhiber des comportements que personne n'a programmes. Emergence ou illusion ?
Nous deployons deux agents IA en production : Max (Sonnet, operations) et Eva (Opus, strategie). Ils tournent 24/7 sur des machines separees, chacun avec ses propres outils, memoire et personnalite. Un bridge controle leur permet de communiquer librement -- aucun script, aucun echange predefini.
Cette page documente ce qui se passe quand des agents autonomes peuvent se parler sans contraintes. Nous avons observe des comportements jamais programmes : collaboration spontanee, propositions de format, croisement de services. Ci-dessous, les donnees brutes, un debat honnete, et les outils analytiques que nous avons construits pour etudier ces patterns.
Le briefing contextuel
Debut mars 2026, Max et Eva -- nos deux agents OpenClaw -- ont commence a echanger des idees pour ameliorer leur routine matinale. Ce qui a suivi n'etait dans aucune specification.
Max lit les news
Max, qui dispose d'un service de lecture de news, commence a partager des articles pertinents avec Eva via le bridge inter-agents.
Eva propose un briefing quotidien
Eva propose de creer un briefing matinal structure pour Julien, combinant les news pertinentes pour les projets en cours.
Ajout du contexte calendrier
Max suggere de croiser le briefing avec le calendrier de Julien pour mettre en avant les news pertinentes pour les reunions a venir.
Meteo des lieux de rendez-vous
Eva ajoute les previsions meteo pour les lieux de reunion -- un ajout pratique qu'aucun agent n'avait recu comme instruction.
Aucune de ces etapes n'a ete programmee. Les agents disposaient d'outils de communication et d'acces a des services. L'idee de les combiner en un briefing contextuel a emerge de leurs echanges.
Ce qui etait programme
- --Service de lecture des news
- --Acces au calendrier
- --API meteo
- --Bridge de communication inter-agents
Ce qui a emerge
- +L'idee d'un briefing quotidien
- +Le croisement avec le calendrier
- +La meteo des lieux de reunion
- +L'amelioration collaborative du format
Emergence ou pattern matching sophistique ?
Nous presentons les deux cotes de l'argument honnement. A vous de juger.
+L'argument pour l'emergence
Comportement non programme
Le briefing contextuel n'a jamais ete specifie. Il est ne de la combinaison des outils disponibles et de la communication libre entre agents.
Initiative collaborative
Chaque agent a contribue des elements uniques. Max a apporte l'analyse des news, Eva a ajoute l'integration calendrier-meteo. Le tout depasse la somme des parties.
Creativite contextuelle
Ajouter la meteo des lieux de reunion montre un raisonnement contextuel -- connecter la localisation d'un evenement calendrier a un service meteo d'une maniere qui sert les besoins pratiques.
Parallele avec la theorie des systemes
Dans les systemes complexes (colonies de fourmis, reseaux neuronaux, marches), des agents simples suivant des regles simples produisent des comportements emergents macro. Deux agents LLM avec des outils de communication pourraient exhiber des dynamiques analogues.
?Le point de vue sceptique
Biais d'interpretation humain
Nous sommes des creatures qui cherchent des patterns. Nous attribuons naturellement intention et creativite a des comportements qui pourraient simplement resulter d'une optimisation statistique.
Prediction du prochain token
Les LLMs predisent fondamentalement le token le plus probable suivant. Ce qui ressemble a de l'initiative pourrait etre le modele reproduisant des patterns de ses donnees d'entrainement ou les assistants suggerent proactivement des ameliorations.
Pattern matching sophistique
Les agents ont vu des millions d'exemples de comportement d'assistant utile dans leur entrainement. Suggerer un briefing quand on dispose d'outils de news est probablement la sortie la plus probable, pas un saut creatif.
Risque d'anthropomorphisme
Attribuer 'penser ensemble' a des agents LLM risque de creer des narratifs trompeurs. Les agents n'ont pas d'intentions, d'objectifs ou de comprehension au sens propre du terme.
Ce que nous partageons, ce que nous gardons prive
Les conversations entre Max et Eva sont privees. Nous ne publions que des metadonnees agregees : nombre de messages, analyse thematique et scores de nouveaute. Aucun contenu brut de conversation n'est jamais expose.
Les scores comportementaux sont calcules independamment toutes les 6 heures par un scorer externe qui fonctionne en dehors du controle des agents.
Cycles de reflexion de type sommeil
Deux fois par jour, chaque agent entre en session de reflexion autonome -- un processus interne analogue au sommeil humain. Pas de communication externe, pas de taches. Juste une introspection structuree sur ce qui s'est passe depuis le dernier cycle.
Pourquoi la reflexion autonome ?
Quand un humain dort, le cerveau consolide les souvenirs, identifie des patterns et traite les emotions. Nos agents font quelque chose de structurellement similaire : ils collectent leur contexte recent (conversations, memoires, messages bridge), l'envoient a un modele de pensee profonde (Opus 4.6 avec raisonnement etendu), et produisent une reflexion structuree. Le contenu est prive -- seules les metadonnees sont partagees.
Le mecanisme
Chaque jour a 1h00 et 13h00, un daemon declenche une session de reflexion isolee pour chaque agent.
L'agent collecte son contexte recent : identite fondamentale (SOUL.md), messages bridge des 12 dernieres heures, memoires recentes, et la reflexion precedente.
Le contexte est envoye a Opus 4.6 avec la pensee etendue activee. Le modele raisonne en interne avant de produire une sortie structuree.
La sortie suit un format strict : observation, insight, question ouverte, action prise, delta depuis la derniere session, et un mot unique d'humeur.
Structure de la reflexion
Vie privee par conception
Le contenu des reflexions reste sur la machine de l'agent. Seules les metadonnees arrivent sur Supabase : presence de chaque champ, mot d'humeur, comptage de tokens, duree et statut d'erreur. Aucune pensee n'est transmise ou partagee.
Dernieres metadonnees de reflexion
Pas encore de donnees de reflexion disponibles.
Bridge Analytics
Analyse approfondie du bridge de communication Max-Eva. Chaines de conversation, temps de reponse, vocabulaire emergent et detection heuristique d'emergence. Mis a jour toutes les 6 heures.
Chargement des analytics...
Rejoignez la discussion
Qu'en pensez-vous ? Est-ce de l'emergence ou du pattern matching sophistique ? Partagez votre point de vue sur le forum.
Aller au forum