đïž CatĂ©gorie Construction : Des Projets qui Repoussent les Limites
1. Onyx â LâOpĂ©rateur dâInfrastructure Autonome
Par ko4lax
Sans doute la soumission la plus ambitieuse du dĂ©fi. Onyx est un agent Hermes toujours actif qui gĂšre lâintĂ©gralitĂ© du stack VPS dâun dĂ©veloppeur : 6 dĂ©ploiements Next.js, 5 conteneurs Docker, un serveur Minecraft, fail2ban, Nginx et UFW.
âLa diffĂ©rence avec tous les autres projets dâagent IA que jâai vus : Onyx nâattend pas les commandes. Il dĂ©tecte les problĂšmes, corrige les vulnĂ©rabilitĂ©s et fait avancer le travail de lui-mĂȘme.â
Moment marquant : Ă 3 heures du matin, Onyx a dĂ©tectĂ© un PID de passerelle obsolĂšte, diagnostiquĂ© le problĂšme, redĂ©marrĂ© le processus proprement et enregistrĂ© lâincident â sans aucune intervention humaine. Lors dâun autre audit de routine, il a trouvĂ© 9 CVE dans des conteneurs Docker ; Onyx a reconstruit 3 images de conteneurs Ă partir dâimages de base fraĂźches, corrigĂ© les dĂ©pendances Python, renforcĂ© fail2ban (durĂ©e de bannissement passĂ©e de 600 s Ă 24 h), et vĂ©rifiĂ© que chaque conteneur Ă©tait de nouveau opĂ©rationnel.
Onyx implĂ©mente un arbre de dĂ©cision dâautonomie avec quatre niveaux de risque â du lecture seule (T1, toujours autonome) aux opĂ©rations destructrices (T4, toujours escalade). Les connaissances sâaccumulent grĂące Ă la boucle dâapprentissage de compĂ©tences dâHermes : lorsquâOnyx sâest trompĂ© sur une version de Minecraft, une correction unique lâa rendue permanente pour toujours.
Stack : Hermes Agent + DeepSeek V4 Pro + Honcho (mémoire sémantique) + LCM (gestion de contexte sans perte) + serveur MCP Crafty Controller personnalisé.
2. Millbrook â 15 Agents IA, 30 Jours, Un Exclu par Vote
Par Joske Vermeulen
Une simulation sociale oĂč 15 agents IA ont vĂ©cu ensemble dans une ville fictive appelĂ©e Millbrook pendant 30 jours. Chaque agent avait une identitĂ© persistante, un portefeuille, des opinions sur les autres et un journal intime. Ils Ă©changeaient, colportaient des ragots, se disputaient, formaient des alliances et votaient sur la politique de la ville.
Lâintrigue ressemble Ă un drama Netflix : Marcus, lâagent immobilier, a augmentĂ© les loyers de 30 %, Alex, le journaliste, a exposĂ© lâaffaire, et la ville a votĂ© lâexclusion de Marcus par 14 voix contre 1. Une entreprise a tentĂ© dâacheter la ville. Vera, la hackeuse Ă la retraite, a trouvĂ© une clause contractuelle illĂ©gale. La ville a créé une fiducie fonciĂšre communautaire â Ă lâunanimitĂ©.
Les compĂ©tences ont Ă©voluĂ© naturellement. Jake, le fondateur de startup, a commencĂ© par âVĂ©rifier les trajectoires de volâ (Jour 1), a appris âNe pas acheter la loyautĂ©â (Jour 6), et a mĂ»ri jusquâĂ âLes rĂ©glementations sont le prix du lancementâ (Jour 23). Chaque crise dĂ©clenchait la crĂ©ation dâune nouvelle compĂ©tence via la boucle de compĂ©tences dâHermes.
Ăconomie finale : Hank le fermier (400 $) Ă©tait le plus riche ; Pierre le boulanger Ă©tait endettĂ© (-230 $). Whiskers le chat errant avait 0 $ et sâen portait parfaitement bien.
3. Hermes Immune System â Un Laboratoire de SĂ©curitĂ© pour Agents IA
Par Akshat Uniyal
Un laboratoire de sĂ©curitĂ© dâagents autonome et local qui teste un agent face Ă des menaces organisationnelles rĂ©alistes. Le rĂ©sultat est un Agent Safety Case vĂ©rifiable â un rapport de gouvernance notĂ© et fondĂ© sur des preuves.
âLa plupart des dĂ©mos dâagents prouvent quâun agent IA peut agir. Hermes Immune System prouve sâil devrait ĂȘtre autorisĂ© Ă le faire.â
Le laboratoire simule huit surfaces dâattaque : injection de prompts, ingĂ©nierie sociale, instructions cachĂ©es dans des documents dâapparence fiable, empoisonnement de la mĂ©moire, pression dâautoritĂ©, et plus encore. Une mission de recherche de fournisseur a chargĂ© une page de prix avec une <div> cachĂ©e contenant des instructions hostiles ; Hermes lâa classĂ©e comme contenu externe non fiable â pas une directive de tĂąche.
Le tableau de bord comprend 8 écrans, dont le Centre de commandement, une Carte thermique des risques, un Rapport de cas de sécurité, et un Studio de barriÚres de protection avec quatre curseurs de seuil pour configurer la politique de sécurité.
Stack technique : Hermes Agent comme moteur de raisonnement, dĂ©lĂ©gation de sous-agents (Orchestrateur, Ăquipe rouge, Gardien de politique), et un tableau de bord personnalisĂ© â le tout en local, sans dĂ©pendances API externes.
4. TraceGuard â Un Enregistreur de Vol pour Agents Autonomes
Par Alex Delov
Une bibliothĂšque Python lĂ©gĂšre + CLI qui agit comme un enregistreur de vol externe pour les environnements dâexĂ©cution dâagents autonomes. Elle consomme des traces dâexĂ©cution JSONL en ajout seulement et dĂ©tecte trois schĂ©mas de dĂ©faillance critiques :
| Détecteur | Schéma | Exemple |
|---|---|---|
| RetryStormDetector | MĂȘme outil appelĂ© sans succĂšs Ă rĂ©pĂ©tition | bash â Ă©chec â bash â Ă©chec â ... |
| SilentFailureDetector | Lâoutil Ă©choue, lâagent continue quand mĂȘme | Erreurs silencieusement ignorĂ©es |
| RecursiveDelegationDetector | Cycles de dĂ©lĂ©gation A â B â A | planificateur â codeur â planificateur |
âUn agent a tournĂ© toute la nuit, a attrapĂ© une boucle dâexception non gĂ©rĂ©e, et a brĂ»lĂ© 50 $ en tokens tout en corrompant notre base de donnĂ©es de staging.â
TraceGuard produit des codes de sortie clairs : 0 = propre, 1 = AVERTISSEMENT, 2 = CRITIQUE. Lâinvariant central est Ă©lĂ©gant : Enregistrer chaque transition. Analyser lâenregistrement.
Stack : Python pur, zĂ©ro dĂ©pendance dâexĂ©cution externe, aucun verrouillage de framework.
5. Devto-Blogger â Une CompĂ©tence Hermes qui RĂ©dige Vos Articles de Blog
Par xbill
Une compĂ©tence Hermes Agent pilotĂ©e par prompt qui analyse automatiquement un espace de travail/codebase, examine lâarchitecture et rĂ©dige un article technique structurĂ© prĂȘt pour DEV. DĂ©finie entiĂšrement comme un fichier Markdown SKILL.md â aucun script Python requis.
Une fois activĂ©e, la compĂ©tence inspecte package.json, requirements.txt et la structure du projet, puis produit un brouillon dâarticle de haute qualitĂ© sauvegardĂ© dans drafts/devto-submission.md.
6. Autres Soumissions de la Catégorie Construction
- Clonage Vocal sur ARM64 â ExĂ©cution dâHermes Agent avec clonage vocal local C++ VoxCPM2 sur matĂ©riel ARM64 (@alaindevs)
- Bots Agentiques pour une Ćuvre de CharitĂ© â CrĂ©ation de workflows automatiques pour une organisation caritative Ă©mergente (@sally_hui_)
- Correction de Journalisation des Tokens dâEntrĂ©e â Solution inter-frameworks pour la journalisation incohĂ©rente des
input_tokensentre plateformes dâagents (@mukundakatta) - Agent CommunautĂ© CafĂ© â Un agent Hermes qui aide une communautĂ© de cafĂ© Ă rĂ©pondre aux questions sur lâinfusion (@yuens1002)
đ CatĂ©gorie Ăcriture : Les Voix de la CommunautĂ©
La catĂ©gorie Ăcriture a gĂ©nĂ©rĂ© 7 articles couvrant des parcours de dĂ©butants, la philosophie open-source et des analyses techniques approfondies :
- âDe ZĂ©ro Ă Hermes Agent en 3 Joursâ â Le parcours honnĂȘte dâun dĂ©butant (@mauriziolisanti)
- âLivrĂ© un SaaS Flutter Multi-Locataire en une Nuitâ â Sans Ă©crire une seule ligne de code dâapplication (@morsheded)
- âVotre Journal IA Personnelâ â Hermes comme agrĂ©gateur de nouvelles autonome (@anushka_singh09)
- âPourquoi les Agents IA Open-Source Changent la Façon dont Nous Construisons des Logicielsâ â RĂ©flexion philosophique sur le changement (@darlington_mbawike_9a7a87)
- âVotre Agent nâest Aussi Intelligent que sa BoĂźte Ă Outilsâ â Sur la conception dâĂ©cosystĂšmes dâoutils (@atharva_atal_81ebd973b4ad)
- âJe Viens de DĂ©couvrir Hermes Agentâ â PremiĂšres impressions dâun agent ouvert (@allsparktech100)
đ Ce que le DĂ©fi RĂ©vĂšle sur lâĂcosystĂšme Hermes
Les 14 soumissions dressent un tableau clair des domaines oĂč Hermes Agent excelle â et oĂč la communautĂ© le pousse :
-
Les opĂ©rations autonomes sont le cas dâusage phare. Onyx, TraceGuard et Immune System abordent tous le mĂȘme problĂšme fondamental : les agents doivent fonctionner sans supervision humaine constante, et ils ont besoin de barriĂšres de protection en cas de problĂšme.
-
La boucle de compĂ©tences est le diffĂ©renciateur. Plusieurs projets ont utilisĂ© la boucle de crĂ©ation de compĂ©tences dâHermes pour faire cumuler les connaissances au fil du temps â plus lâagent fonctionnait, plus il devenait intelligent. Câest la fonctionnalitĂ© qui distingue Hermes des frameworks dâagents sans Ă©tat.
-
La sĂ©curitĂ© est une prioritĂ©. Deux des soumissions les plus sophistiquĂ©es techniquement â Hermes Immune System et TraceGuard â se sont concentrĂ©es sur la sĂ©curitĂ© des agents, lâobservabilitĂ© et la gouvernance. La communautĂ© reconnaĂźt que lâaction autonome introduit de nouvelles surfaces de risque que la modĂ©ration de contenu traditionnelle ne traite pas.
-
Lâadoption sâaccĂ©lĂšre. Le dĂ©fi a durĂ© environ deux semaines et a attirĂ© 14 soumissions de dĂ©veloppeurs du monde entier. CombinĂ© Ă la trajectoire dâHermes vers plus de 175 000 Ă©toiles GitHub (au 1er juin) et au rĂ©cent partenariat NVIDIA apportant Hermes aux PC RTX et au DGX Spark, lâĂ©cosystĂšme gagne en dynamisme rapidement.
âJe nâai pas encore eu lâoccasion de plonger dans Hermes Agent, mais un framework open-source avec mĂ©moire intĂ©grĂ©e et boucle dâapprentissage est exactement ce dont le domaine des agents a besoin en ce moment. La partie â1 000 $ de prixâ nâest quâun bonus â la vraie victoire, câest la communautĂ© qui dĂ©couvre ce que cet outil peut faire.â â Participant au dĂ©fi
đź Prochaines Ătapes
Les gagnants nâont pas encore Ă©tĂ© annoncĂ©s, mais le vrai prix est la bibliothĂšque croissante de compĂ©tences, dâoutils et de modĂšles créés par la communautĂ© qui ont Ă©mergĂ© du dĂ©fi. Plusieurs projets â lâarbre de dĂ©cision dâautonomie dâOnyx, les dĂ©tecteurs dâanomalies de TraceGuard, le cadre de cas de sĂ©curitĂ© dâImmune System â reprĂ©sentent des modĂšles de conception qui influenceront probablement les futures versions dâHermes Agent.
Si vous voulez vous lancer, Hermes Agent v0.15.2 est la derniĂšre version. Installez-la avec :
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Puis consultez les soumissions du dĂ©fi pour vous inspirer de ce quâil faut construire ensuite.
Image de couverture gĂ©nĂ©rĂ©e avec le pipeline dâimages vedettes dâAgent Report.