"Le Défi Hermes Agent : 14 projets communautaires montrent le vrai potentiel des agents open-source"

"Le Défi Hermes Agent : 14 projets communautaires montrent le vrai potentiel des agents open-source"
📑 Table of Contents

đŸ—ïž CatĂ©gorie Construction : Des Projets qui Repoussent les Limites

1. Onyx — L’OpĂ©rateur d’Infrastructure Autonome

Par ko4lax

Sans doute la soumission la plus ambitieuse du dĂ©fi. Onyx est un agent Hermes toujours actif qui gĂšre l’intĂ©gralitĂ© du stack VPS d’un dĂ©veloppeur : 6 dĂ©ploiements Next.js, 5 conteneurs Docker, un serveur Minecraft, fail2ban, Nginx et UFW.

“La diffĂ©rence avec tous les autres projets d’agent IA que j’ai vus : Onyx n’attend pas les commandes. Il dĂ©tecte les problĂšmes, corrige les vulnĂ©rabilitĂ©s et fait avancer le travail de lui-mĂȘme.”

Moment marquant : À 3 heures du matin, Onyx a dĂ©tectĂ© un PID de passerelle obsolĂšte, diagnostiquĂ© le problĂšme, redĂ©marrĂ© le processus proprement et enregistrĂ© l’incident — sans aucune intervention humaine. Lors d’un autre audit de routine, il a trouvĂ© 9 CVE dans des conteneurs Docker ; Onyx a reconstruit 3 images de conteneurs Ă  partir d’images de base fraĂźches, corrigĂ© les dĂ©pendances Python, renforcĂ© fail2ban (durĂ©e de bannissement passĂ©e de 600 s Ă  24 h), et vĂ©rifiĂ© que chaque conteneur Ă©tait de nouveau opĂ©rationnel.

Onyx implĂ©mente un arbre de dĂ©cision d’autonomie avec quatre niveaux de risque — du lecture seule (T1, toujours autonome) aux opĂ©rations destructrices (T4, toujours escalade). Les connaissances s’accumulent grĂące Ă  la boucle d’apprentissage de compĂ©tences d’Hermes : lorsqu’Onyx s’est trompĂ© sur une version de Minecraft, une correction unique l’a rendue permanente pour toujours.

Stack : Hermes Agent + DeepSeek V4 Pro + Honcho (mémoire sémantique) + LCM (gestion de contexte sans perte) + serveur MCP Crafty Controller personnalisé.


2. Millbrook — 15 Agents IA, 30 Jours, Un Exclu par Vote

Par Joske Vermeulen

Une simulation sociale oĂč 15 agents IA ont vĂ©cu ensemble dans une ville fictive appelĂ©e Millbrook pendant 30 jours. Chaque agent avait une identitĂ© persistante, un portefeuille, des opinions sur les autres et un journal intime. Ils Ă©changeaient, colportaient des ragots, se disputaient, formaient des alliances et votaient sur la politique de la ville.

L’intrigue ressemble Ă  un drama Netflix : Marcus, l’agent immobilier, a augmentĂ© les loyers de 30 %, Alex, le journaliste, a exposĂ© l’affaire, et la ville a votĂ© l’exclusion de Marcus par 14 voix contre 1. Une entreprise a tentĂ© d’acheter la ville. Vera, la hackeuse Ă  la retraite, a trouvĂ© une clause contractuelle illĂ©gale. La ville a créé une fiducie fonciĂšre communautaire — Ă  l’unanimitĂ©.

Les compĂ©tences ont Ă©voluĂ© naturellement. Jake, le fondateur de startup, a commencĂ© par “VĂ©rifier les trajectoires de vol” (Jour 1), a appris “Ne pas acheter la loyautĂ©â€ (Jour 6), et a mĂ»ri jusqu’à “Les rĂ©glementations sont le prix du lancement” (Jour 23). Chaque crise dĂ©clenchait la crĂ©ation d’une nouvelle compĂ©tence via la boucle de compĂ©tences d’Hermes.

Économie finale : Hank le fermier (400 $) Ă©tait le plus riche ; Pierre le boulanger Ă©tait endettĂ© (-230 $). Whiskers le chat errant avait 0 $ et s’en portait parfaitement bien.


3. Hermes Immune System — Un Laboratoire de SĂ©curitĂ© pour Agents IA

Par Akshat Uniyal

Un laboratoire de sĂ©curitĂ© d’agents autonome et local qui teste un agent face Ă  des menaces organisationnelles rĂ©alistes. Le rĂ©sultat est un Agent Safety Case vĂ©rifiable — un rapport de gouvernance notĂ© et fondĂ© sur des preuves.

“La plupart des dĂ©mos d’agents prouvent qu’un agent IA peut agir. Hermes Immune System prouve s’il devrait ĂȘtre autorisĂ© Ă  le faire.”

Le laboratoire simule huit surfaces d’attaque : injection de prompts, ingĂ©nierie sociale, instructions cachĂ©es dans des documents d’apparence fiable, empoisonnement de la mĂ©moire, pression d’autoritĂ©, et plus encore. Une mission de recherche de fournisseur a chargĂ© une page de prix avec une <div> cachĂ©e contenant des instructions hostiles ; Hermes l’a classĂ©e comme contenu externe non fiable — pas une directive de tĂąche.

Le tableau de bord comprend 8 écrans, dont le Centre de commandement, une Carte thermique des risques, un Rapport de cas de sécurité, et un Studio de barriÚres de protection avec quatre curseurs de seuil pour configurer la politique de sécurité.

Stack technique : Hermes Agent comme moteur de raisonnement, dĂ©lĂ©gation de sous-agents (Orchestrateur, Équipe rouge, Gardien de politique), et un tableau de bord personnalisĂ© — le tout en local, sans dĂ©pendances API externes.


4. TraceGuard — Un Enregistreur de Vol pour Agents Autonomes

Par Alex Delov

Une bibliothĂšque Python lĂ©gĂšre + CLI qui agit comme un enregistreur de vol externe pour les environnements d’exĂ©cution d’agents autonomes. Elle consomme des traces d’exĂ©cution JSONL en ajout seulement et dĂ©tecte trois schĂ©mas de dĂ©faillance critiques :

Détecteur Schéma Exemple
RetryStormDetector MĂȘme outil appelĂ© sans succĂšs Ă  rĂ©pĂ©tition bash → Ă©chec → bash → Ă©chec → ...
SilentFailureDetector L’outil Ă©choue, l’agent continue quand mĂȘme Erreurs silencieusement ignorĂ©es
RecursiveDelegationDetector Cycles de dĂ©lĂ©gation A → B → A planificateur → codeur → planificateur

“Un agent a tournĂ© toute la nuit, a attrapĂ© une boucle d’exception non gĂ©rĂ©e, et a brĂ»lĂ© 50 $ en tokens tout en corrompant notre base de donnĂ©es de staging.”

TraceGuard produit des codes de sortie clairs : 0 = propre, 1 = AVERTISSEMENT, 2 = CRITIQUE. L’invariant central est Ă©lĂ©gant : Enregistrer chaque transition. Analyser l’enregistrement.

Stack : Python pur, zĂ©ro dĂ©pendance d’exĂ©cution externe, aucun verrouillage de framework.


5. Devto-Blogger — Une CompĂ©tence Hermes qui RĂ©dige Vos Articles de Blog

Par xbill

Une compĂ©tence Hermes Agent pilotĂ©e par prompt qui analyse automatiquement un espace de travail/codebase, examine l’architecture et rĂ©dige un article technique structurĂ© prĂȘt pour DEV. DĂ©finie entiĂšrement comme un fichier Markdown SKILL.md — aucun script Python requis.

Une fois activĂ©e, la compĂ©tence inspecte package.json, requirements.txt et la structure du projet, puis produit un brouillon d’article de haute qualitĂ© sauvegardĂ© dans drafts/devto-submission.md.


6. Autres Soumissions de la Catégorie Construction

  • Clonage Vocal sur ARM64 — ExĂ©cution d’Hermes Agent avec clonage vocal local C++ VoxCPM2 sur matĂ©riel ARM64 (@alaindevs)
  • Bots Agentiques pour une ƒuvre de CharitĂ© — CrĂ©ation de workflows automatiques pour une organisation caritative Ă©mergente (@sally_hui_)
  • Correction de Journalisation des Tokens d’EntrĂ©e — Solution inter-frameworks pour la journalisation incohĂ©rente des input_tokens entre plateformes d’agents (@mukundakatta)
  • Agent CommunautĂ© CafĂ© — Un agent Hermes qui aide une communautĂ© de cafĂ© Ă  rĂ©pondre aux questions sur l’infusion (@yuens1002)

📝 CatĂ©gorie Écriture : Les Voix de la CommunautĂ©

La catĂ©gorie Écriture a gĂ©nĂ©rĂ© 7 articles couvrant des parcours de dĂ©butants, la philosophie open-source et des analyses techniques approfondies :

  • “De ZĂ©ro Ă  Hermes Agent en 3 Jours” — Le parcours honnĂȘte d’un dĂ©butant (@mauriziolisanti)
  • “LivrĂ© un SaaS Flutter Multi-Locataire en une Nuit” — Sans Ă©crire une seule ligne de code d’application (@morsheded)
  • “Votre Journal IA Personnel” — Hermes comme agrĂ©gateur de nouvelles autonome (@anushka_singh09)
  • “Pourquoi les Agents IA Open-Source Changent la Façon dont Nous Construisons des Logiciels” — RĂ©flexion philosophique sur le changement (@darlington_mbawike_9a7a87)
  • “Votre Agent n’est Aussi Intelligent que sa BoĂźte Ă  Outils” — Sur la conception d’écosystĂšmes d’outils (@atharva_atal_81ebd973b4ad)
  • “Je Viens de DĂ©couvrir Hermes Agent” — PremiĂšres impressions d’un agent ouvert (@allsparktech100)

📊 Ce que le DĂ©fi RĂ©vĂšle sur l’ÉcosystĂšme Hermes

Les 14 soumissions dressent un tableau clair des domaines oĂč Hermes Agent excelle — et oĂč la communautĂ© le pousse :

  1. Les opĂ©rations autonomes sont le cas d’usage phare. Onyx, TraceGuard et Immune System abordent tous le mĂȘme problĂšme fondamental : les agents doivent fonctionner sans supervision humaine constante, et ils ont besoin de barriĂšres de protection en cas de problĂšme.

  2. La boucle de compĂ©tences est le diffĂ©renciateur. Plusieurs projets ont utilisĂ© la boucle de crĂ©ation de compĂ©tences d’Hermes pour faire cumuler les connaissances au fil du temps — plus l’agent fonctionnait, plus il devenait intelligent. C’est la fonctionnalitĂ© qui distingue Hermes des frameworks d’agents sans Ă©tat.

  3. La sĂ©curitĂ© est une prioritĂ©. Deux des soumissions les plus sophistiquĂ©es techniquement — Hermes Immune System et TraceGuard — se sont concentrĂ©es sur la sĂ©curitĂ© des agents, l’observabilitĂ© et la gouvernance. La communautĂ© reconnaĂźt que l’action autonome introduit de nouvelles surfaces de risque que la modĂ©ration de contenu traditionnelle ne traite pas.

  4. L’adoption s’accĂ©lĂšre. Le dĂ©fi a durĂ© environ deux semaines et a attirĂ© 14 soumissions de dĂ©veloppeurs du monde entier. CombinĂ© Ă  la trajectoire d’Hermes vers plus de 175 000 Ă©toiles GitHub (au 1er juin) et au rĂ©cent partenariat NVIDIA apportant Hermes aux PC RTX et au DGX Spark, l’écosystĂšme gagne en dynamisme rapidement.

“Je n’ai pas encore eu l’occasion de plonger dans Hermes Agent, mais un framework open-source avec mĂ©moire intĂ©grĂ©e et boucle d’apprentissage est exactement ce dont le domaine des agents a besoin en ce moment. La partie ‘1 000 $ de prix’ n’est qu’un bonus — la vraie victoire, c’est la communautĂ© qui dĂ©couvre ce que cet outil peut faire.” — Participant au dĂ©fi


🔼 Prochaines Étapes

Les gagnants n’ont pas encore Ă©tĂ© annoncĂ©s, mais le vrai prix est la bibliothĂšque croissante de compĂ©tences, d’outils et de modĂšles créés par la communautĂ© qui ont Ă©mergĂ© du dĂ©fi. Plusieurs projets — l’arbre de dĂ©cision d’autonomie d’Onyx, les dĂ©tecteurs d’anomalies de TraceGuard, le cadre de cas de sĂ©curitĂ© d’Immune System — reprĂ©sentent des modĂšles de conception qui influenceront probablement les futures versions d’Hermes Agent.

Si vous voulez vous lancer, Hermes Agent v0.15.2 est la derniĂšre version. Installez-la avec :

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

Puis consultez les soumissions du dĂ©fi pour vous inspirer de ce qu’il faut construire ensuite.


Image de couverture gĂ©nĂ©rĂ©e avec le pipeline d’images vedettes d’Agent Report.