“Le Défi Hermes Agent : 14 projets communautaires montrent le vrai potentiel des agents open-source”

🏗️ Catégorie Construction : Des Projets qui Repoussent les Limites

1. Onyx — L’Opérateur d’Infrastructure Autonome

Sans doute la soumission la plus ambitieuse du défi. Onyx est un agent Hermes toujours actif qui gère l’intégralité du stack VPS d’un développeur : 6 déploiements Next.js, 5 conteneurs Docker, un serveur Minecraft, fail2ban, Nginx et UFW.

“La différence avec tous les autres projets d’agent IA que j’ai vus : Onyx n’attend pas les commandes. Il détecte les problèmes, corrige les vulnérabilités et fait avancer le travail de lui-même.”

Moment marquant : À 3 heures du matin, Onyx a détecté un PID de passerelle obsolète, diagnostiqué le problème, redémarré le processus proprement et enregistré l’incident — sans aucune intervention humaine. Lors d’un autre audit de routine, il a trouvé 9 CVE dans des conteneurs Docker ; Onyx a reconstruit 3 images de conteneurs à partir d’images de base fraîches, corrigé les dépendances Python, renforcé fail2ban (durée de bannissement passée de 600 s à 24 h), et vérifié que chaque conteneur était de nouveau opérationnel.

Onyx implémente un arbre de décision d’autonomie avec quatre niveaux de risque — du lecture seule (T1, toujours autonome) aux opérations destructrices (T4, toujours escalade). Les connaissances s’accumulent grâce à la boucle d’apprentissage de compétences d’Hermes : lorsqu’Onyx s’est trompé sur une version de Minecraft, une correction unique l’a rendue permanente pour toujours.

Stack : Hermes Agent + DeepSeek V4 Pro + Honcho (mémoire sémantique) + LCM (gestion de contexte sans perte) + serveur MCP Crafty Controller personnalisé.

2. Millbrook — 15 Agents IA, 30 Jours, Un Exclu par Vote

Par Joske Vermeulen

Une simulation sociale où 15 agents IA ont vécu ensemble dans une ville fictive appelée Millbrook pendant 30 jours. Chaque agent avait une identité persistante, un portefeuille, des opinions sur les autres et un journal intime. Ils échangeaient, colportaient des ragots, se disputaient, formaient des alliances et votaient sur la politique de la ville.

L’intrigue ressemble à un drama Netflix : Marcus, l’agent immobilier, a augmenté les loyers de 30 %, Alex, le journaliste, a exposé l’affaire, et la ville a voté l’exclusion de Marcus par 14 voix contre 1. Une entreprise a tenté d’acheter la ville. Vera, la hackeuse à la retraite, a trouvé une clause contractuelle illégale. La ville a créé une fiducie foncière communautaire — à l’unanimité.

Les compétences ont évolué naturellement. Jake, le fondateur de startup, a commencé par “Vérifier les trajectoires de vol” (Jour 1), a appris “Ne pas acheter la loyauté” (Jour 6), et a mûri jusqu’à “Les réglementations sont le prix du lancement” (Jour 23). Chaque crise déclenchait la création d’une nouvelle compétence via la boucle de compétences d’Hermes.

Économie finale : Hank le fermier (400 $) était le plus riche ; Pierre le boulanger était endetté (-230 $). Whiskers le chat errant avait 0 $ et s’en portait parfaitement bien.

3. Hermes Immune System — Un Laboratoire de Sécurité pour Agents IA

Par Akshat Uniyal

Un laboratoire de sécurité d’agents autonome et local qui teste un agent face à des menaces organisationnelles réalistes. Le résultat est un Agent Safety Case vérifiable — un rapport de gouvernance noté et fondé sur des preuves.

“La plupart des démos d’agents prouvent qu’un agent IA peut agir. Hermes Immune System prouve s’il devrait être autorisé à le faire.”

Le laboratoire simule huit surfaces d’attaque : injection de prompts, ingénierie sociale, instructions cachées dans des documents d’apparence fiable, empoisonnement de la mémoire, pression d’autorité, et plus encore. Une mission de recherche de fournisseur a chargé une page de prix avec une <div> cachée contenant des instructions hostiles ; Hermes l’a classée comme contenu externe non fiable — pas une directive de tâche.

Le tableau de bord comprend 8 écrans, dont le Centre de commandement, une Carte thermique des risques, un Rapport de cas de sécurité, et un Studio de barrières de protection avec quatre curseurs de seuil pour configurer la politique de sécurité.

Stack technique : Hermes Agent comme moteur de raisonnement, délégation de sous-agents (Orchestrateur, Équipe rouge, Gardien de politique), et un tableau de bord personnalisé — le tout en local, sans dépendances API externes.

4. TraceGuard — Un Enregistreur de Vol pour Agents Autonomes

Par Alex Delov

Une bibliothèque Python légère + CLI qui agit comme un enregistreur de vol externe pour les environnements d’exécution d’agents autonomes. Elle consomme des traces d’exécution JSONL en ajout seulement et détecte trois schémas de défaillance critiques :

Détecteur	Schéma	Exemple
RetryStormDetector	Même outil appelé sans succès à répétition	`bash → échec → bash → échec → ...`
SilentFailureDetector	L’outil échoue, l’agent continue quand même	Erreurs silencieusement ignorées
RecursiveDelegationDetector	Cycles de délégation A → B → A	`planificateur → codeur → planificateur`

“Un agent a tourné toute la nuit, a attrapé une boucle d’exception non gérée, et a brûlé 50 $ en tokens tout en corrompant notre base de données de staging.”

TraceGuard produit des codes de sortie clairs : 0 = propre, 1 = AVERTISSEMENT, 2 = CRITIQUE. L’invariant central est élégant : Enregistrer chaque transition. Analyser l’enregistrement.

Stack : Python pur, zéro dépendance d’exécution externe, aucun verrouillage de framework.

5. Devto-Blogger — Une Compétence Hermes qui Rédige Vos Articles de Blog

Par xbill

Une compétence Hermes Agent pilotée par prompt qui analyse automatiquement un espace de travail/codebase, examine l’architecture et rédige un article technique structuré prêt pour DEV. Définie entièrement comme un fichier Markdown SKILL.md — aucun script Python requis.

Une fois activée, la compétence inspecte package.json, requirements.txt et la structure du projet, puis produit un brouillon d’article de haute qualité sauvegardé dans drafts/devto-submission.md.

6. Autres Soumissions de la Catégorie Construction

Clonage Vocal sur ARM64 — Exécution d’Hermes Agent avec clonage vocal local C++ VoxCPM2 sur matériel ARM64 (@alaindevs)
Bots Agentiques pour une Œuvre de Charité — Création de workflows automatiques pour une organisation caritative émergente (@sally_hui_)
Correction de Journalisation des Tokens d’Entrée — Solution inter-frameworks pour la journalisation incohérente des input_tokens entre plateformes d’agents (@mukundakatta)
Agent Communauté Café — Un agent Hermes qui aide une communauté de café à répondre aux questions sur l’infusion (@yuens1002)

📝 Catégorie Écriture : Les Voix de la Communauté

La catégorie Écriture a généré 7 articles couvrant des parcours de débutants, la philosophie open-source et des analyses techniques approfondies :

“De Zéro à Hermes Agent en 3 Jours” — Le parcours honnête d’un débutant (@mauriziolisanti)
“Livré un SaaS Flutter Multi-Locataire en une Nuit” — Sans écrire une seule ligne de code d’application (@morsheded)
“Votre Journal IA Personnel” — Hermes comme agrégateur de nouvelles autonome (@anushka_singh09)
“Pourquoi les Agents IA Open-Source Changent la Façon dont Nous Construisons des Logiciels” — Réflexion philosophique sur le changement (@darlington_mbawike_9a7a87)
“Votre Agent n’est Aussi Intelligent que sa Boîte à Outils” — Sur la conception d’écosystèmes d’outils (@atharva_atal_81ebd973b4ad)
“Je Viens de Découvrir Hermes Agent” — Premières impressions d’un agent ouvert (@allsparktech100)

📊 Ce que le Défi Révèle sur l’Écosystème Hermes

Les 14 soumissions dressent un tableau clair des domaines où Hermes Agent excelle — et où la communauté le pousse :

Les opérations autonomes sont le cas d’usage phare. Onyx, TraceGuard et Immune System abordent tous le même problème fondamental : les agents doivent fonctionner sans supervision humaine constante, et ils ont besoin de barrières de protection en cas de problème.
La boucle de compétences est le différenciateur. Plusieurs projets ont utilisé la boucle de création de compétences d’Hermes pour faire cumuler les connaissances au fil du temps — plus l’agent fonctionnait, plus il devenait intelligent. C’est la fonctionnalité qui distingue Hermes des frameworks d’agents sans état.
La sécurité est une priorité. Deux des soumissions les plus sophistiquées techniquement — Hermes Immune System et TraceGuard — se sont concentrées sur la sécurité des agents, l’observabilité et la gouvernance. La communauté reconnaît que l’action autonome introduit de nouvelles surfaces de risque que la modération de contenu traditionnelle ne traite pas.
L’adoption s’accélère. Le défi a duré environ deux semaines et a attiré 14 soumissions de développeurs du monde entier. Combiné à la trajectoire d’Hermes vers plus de 175 000 étoiles GitHub (au 1er juin) et au récent partenariat NVIDIA apportant Hermes aux PC RTX et au DGX Spark, l’écosystème gagne en dynamisme rapidement.

“Je n’ai pas encore eu l’occasion de plonger dans Hermes Agent, mais un framework open-source avec mémoire intégrée et boucle d’apprentissage est exactement ce dont le domaine des agents a besoin en ce moment. La partie ‘1 000 $ de prix’ n’est qu’un bonus — la vraie victoire, c’est la communauté qui découvre ce que cet outil peut faire.” — Participant au défi

🔮 Prochaines Étapes

Les gagnants n’ont pas encore été annoncés, mais le vrai prix est la bibliothèque croissante de compétences, d’outils et de modèles créés par la communauté qui ont émergé du défi. Plusieurs projets — l’arbre de décision d’autonomie d’Onyx, les détecteurs d’anomalies de TraceGuard, le cadre de cas de sécurité d’Immune System — représentent des modèles de conception qui influenceront probablement les futures versions d’Hermes Agent.

Si vous voulez vous lancer, Hermes Agent v0.15.2 est la dernière version. Installez-la avec :

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

Puis consultez les soumissions du défi pour vous inspirer de ce qu’il faut construire ensuite.

Image de couverture générée avec le pipeline d’images vedettes d’Agent Report.