Anfang 2026 veröffentlichte Nous Research den Hermes Agent; binnen zwei Monaten überschritt das GitHub-Repo 160.000 Stars. Leitmotiv: „the agent that grows with you“ — der Agent wird mit jeder Nutzung präziser. Träger ist das Skills-System: standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis statt Einmal-Prompt. Dieser Beitrag richtet sich an Entwickler, die Hermes bereits kennen, und deckt SKILL.md-Format, Skill Bundles, bedingte Aktivierung, Tap-Publishing, GEPA+DSPy-Selbstevolution, Plugin-Skills und Open-Source-Ökosystem systematisch ab. Felder und Limits bitte in der Hermes- und agentskills.io-Dokumentation gegenprüfen. Mietpreise: NOVAKVM-Mietpreisseite. EU-Teams, die Ausführungstraces in ~/.hermes/ oder über Cloud-LLM-APIs verarbeiten, sollten Aufbewahrung, Export und Löschung bei Vertragsende in ihre DSGVO-Dokumentation aufnehmen.
[ SECTION_01 ] // PAIN_MAP Warum sich das Hermes-Skills-System einer vertieften Analyse lohnt
- Token-Explosion: Komplette SOPs im System-Prompt verbrennen bei jedem Turn Tokens; Progressive Disclosure lädt den Skill-Body erst nach Aktivierung.
- Amnesie über Sitzungen: Normale Prompts gelten nur aktuell; Skills und Memory persistieren — Skills lehren wie, Memory speichert was.
- Fragmentierte Workflows: PR-Review, TDD und Deploy-Checks in getrennten Chats; Skill Bundles laden per Slash-Befehl das gesamte Set.
- Fehlende Umgebungswahrnehmung: Mit bezahltem
web_searchDuckDuckGo-Fallback-Skills zu laden verschwendet Kontext; bedingte Aktivierung blendet Skills nach Tool-Verfügbarkeit aus. - Stagnierende Skill-Qualität: Handgeschriebene SKILL.md-Dateien werden selten iteriert; GEPA optimiert Skill-Text aus Ausführungstraces ohne Modell-Fine-Tuning.
- Kein Team-Sharing: Skills verstreut in persönlichen Ordnern; Tap-Repos plus
hermes skills tap addabonnieren eine gemeinsame Quelle. - Verwechslung mit MCP: Skills sind prozedurales Wissen, MCP liefert Tool-Schnittstellen — komplementär, nicht austauschbar.
Fünf Leitfragen für Fortgeschrittene: Wie steuert Progressive Disclosure Tokens? Wie konfiguriert man bedingte Aktivierung? Wie triggert ein Bundle den ganzen Workflow? Wie verbessert GEPA Skills über Zeit? Welche Community-Taps lohnen sich? Die folgenden Abschnitte beantworten das der Reihe nach.
[ SECTION_02 ] // MATRIX Hermes Skills, Memory und normaler Prompt — wo liegt der Unterschied?
| Dimension | Normaler Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktuelle Sitzung | Sitzungsübergreifend, dauerhaft | Sitzungsübergreifend, dauerhaft |
| Ladezeitpunkt | Immer im Kontext | Pro Sitzung automatisch injiziert | On-Demand |
| Token-Kosten | Bei jedem Turn | Klein und stabil | Body vor Aktivierung: null |
| Inhaltstyp | Beliebige Absicht | Präferenzen und Fakten | Prozedurale Schritte |
| Pflege | Manuell durch Nutzer | Automatisch durch Agent | Nutzer und Agent |
| Teilbarkeit | Unbequem | Privat | Als Community-Tap veröffentlichbar |
Merksatz: Prompt = Haftnotiz (gültig jetzt); Memory = Notizblock (dauerhaft griffbereit); Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geöffnet).
[ SECTION_03 ] // STRUCTURE SKILL.md im Detail und Progressive Disclosure in drei Stufen
Alle Hermes Skills folgen dem offenen Standard agentskills.io und portieren zwischen Hermes, Claude Code und Cursor. Empfohlene Verzeichnisstruktur:
SKILL.md
references/
templates/
scripts/
Hauptdatei SKILL.md idealerweise ≤500 Zeilen; references/ für API-Docs, templates/ für wiederverwendbare Vorlagen, scripts/ für direkt ausführbare Skripte.
---
name: my-skill
description: |
Use when the user needs to [...].
Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
Progressive Disclosure ist der Token-Hebel:
| Stufe | Inhalt | Trigger | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description |
Sitzungsstart, Scan aller Skills | Alle Skills zusammen ca. 3K |
| Level 1 | Vollständiger SKILL.md-Body | /skill-name oder LLM-Entscheid |
Abhängig von Dateilänge |
| Level 2 | references/, scripts/ |
Bei Ausführung nach LLM-Entscheid | Pro Datei on-demand |
Der Body sollte Overview, When to Use, Procedure, Common Pitfalls, Verification Checklist enthalten. Entscheidend: description ist die einzige Level-0-Routing-Info — „wann nutzen“ schlägt „was ist es“. Beginnen Sie mit „Use when…“, max. 1024 Zeichen; name nur Kleinbuchstaben und Bindestriche, max. 64 Zeichen.
[ SECTION_04 ] // WORKFLOW Skill Bundles und bedingte Aktivierung: ein Befehl, ganzer Workflow
Skill Bundles (Neuheit 2026) bündeln mehrere Skills als Slash-Befehl; bei /bundle-name werden gelistete Skills gleichzeitig geladen. Datei unter ~/.hermes/skill-bundles/<slug>.yaml:
name: backend-dev
description: |
Full backend feature workflow — code review, TDD, and PR management.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first before implementation.
Never push directly to main.
Beispiele: research-session mit arxiv, deep-research, plan, excalidraw; mlops-deploy mit vllm, llama-cpp, github-pr-workflow, systematic-debugging. Regeln: Bei Namenskollision gewinnt das Bundle; fehlende Skills werden übersprungen und gemeldet; keine Änderung am System-Prompt — Prompt-Cache-freundlich. Schnellanlage per CLI:
hermes bundles create backend-dev \
--skills github-code-review,test-driven-development,github-pr-workflow \
--instruction "Always write failing tests first"
Bedingte Aktivierung unter metadata.hermes steuert Sichtbarkeit nach Tool-Verfügbarkeit:
- requires_toolsets / requires_tools: Skill ausblenden, wenn genannte Tools fehlen.
- fallback_for_toolsets / fallback_for_tools: Skill ausblenden, wenn genannte Tools vorhanden sind (Fallback-Rolle).
Klassisches Szenario: Mit FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich bezahltes web_search; duckduckgo-search verschwindet dank fallback_for_tools: [web_search]. Fällt die API aus, taucht der Fallback wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] und platforms: [telegram, discord]; die TUI hermes skills schaltet Skills pro CLI, Telegram und Discord separat.
[ SECTION_05 ] // ECOSYSTEM Skills Hub, Open-Source-Ökosystem und eigenes Skill Tap veröffentlichen
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
| Repository | Schwerpunkt |
|---|---|
| ChuckSRQ/awesome-hermes-skills | Produktionsreife Sammlung: Deep Research, MLOps, Apple-Integration; 23 Skills für GitHub Copilot |
| amanning3390/hermeshub | Community-Registry mit Security-Scan, API und Marktplatz |
| kevinnft/ai-agent-skills | 191 Skills in 28 Kategorien, portabel für Hermes/Claude Code/Cursor |
| NousResearch/hermes-agent | Offizielle Quelle mit allen Built-in-Skills und Authoring-Spec |
Skill Tap veröffentlichen: GitHub-Repo als Skill-Quelle anlegen, Team führt hermes skills tap add github:your-org/your-skills-tap aus; private Repos mit --token $GH_TOKEN; Updates via hermes skills tap update. Optional skills.sh.json für Hub-Kategorien. ~/.hermes/skills/ per Git versionieren für Gerätesync; danach hermes skills reset für Built-ins. Der agentskills.io-Standard entkoppelt Assets von einer Plattform — Validierung mit skills-ref validate ./my-skill.
Offizielle Einstiegspunkte — nach jedem Upstream-Release Links erneut öffnen:
Hermes Agent Skills — Benutzerdokumentation
Creating Skills — Entwicklerleitfaden
agentskills.io — offizielle Spezifikation
hermes-agent-self-evolution (GEPA-Tool-Repo)
[ SECTION_06 ] // EVOLUTION GEPA + DSPy: Skills automatisch verbessern, ohne Modellgewichte anzufassen
GEPA (Genetic-Pareto Prompt Evolution), ICLR 2026 Oral, lebt in hermes-agent-self-evolution. Ablauf: Ausführungstraces analysieren → Varianten erzeugen → multiobjektive Pareto-Optimierung → SKILL.md-Text verbessern, ohne Fine-Tuning. Kosten pro Lauf typisch 2–10 USD reine API, kein GPU nötig.
Fünf Phasen: ① Trace-Sammlung (SQLite, vollständige Reasoning-Pfade) → ② reflexive Fehleranalyse (handlungsrelevante Side-Information) → ③ gezielte Mutation (10–20 SKILL.md-Varianten pro Failure) → ④ Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit) → ⑤ menschliches PR-Review (beste Variante live).
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
Vier Sicherheitsgeländer: Volllauf-Tests 100 % grün; Skills ≤15 KB, Tool-Beschreibungen ≤500 Zeichen; Prompt Cache unverändert; semantische Treue zum ursprünglichen Zweck. Roadmap: Phase 1 Skill-Dateien (✅) → Phase 2 Tool-Beschreibungen → Phase 3 System-Prompt → Phase 4 Tool-Implementierung → Phase 5 vollautomatischer Loop. Dank agentskills.io können Claude-Code- oder Gemini-CLI-Traces mitgefüttert werden: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions. Enthalten Traces personenbezogene Inhalte, Löschfristen und Zugriffskontrolle DSGVO-konform dokumentieren.
[ SECTION_07 ] // ADVANCED Plugin-Skills, fortgeschrittenes Authoring und Blog-Workflow-Praxis
Plugin-Bundled Skills laden über Namespace plugin:skill, erscheinen nicht in der Standard-skills_list und aktivieren nur bei explizitem Aufruf; Skills desselben Plugins können sich gegenseitig wahrnehmen. In plugin.yaml den skills-Pfad deklarieren.
Authoring aus Engineer-Sicht:
- description bestimmt Treffgenauigkeit: „Use when reviewing a pull request…Do NOT use for writing new code“ statt „Helps with code“.
- Pitfalls als Qualitätsgrenze: konkrete Failure-Modes, Ursache und Fix (fragile CSS-Selektoren, GitHub-Rate-Limits, große Diffs).
- Skripte einbinden: Procedure verweist auf
scripts/extract_schema.py; bei Fehlerreferences/manual-extract.mdnachladen. - Größenkontrolle: <500 Zeilen in SKILL.md; 500–1000 in references; >15 KB zwingend splitten (GEPA-Limit).
- skill_manage: Agent nutzt
action='patch'|'create'; inconfig.yamlagent_writes_require_approval: truefür menschliches Gate.
Blog-Workflow-Case: Bundle blog-workflow mit seo-keyword-research, outline-generator, code-example-validator, bilingual-checker, publish-to-platform; Instruction verlangt SEO-Recherche, lauffähige Code-Beispiele, zweisprachige Titel. Nach Skill-Änderung in der laufenden Sitzung: /reset oder Installation mit --now (invalidiert Prompt Cache).
FAQ: Skills lehren Prozesse, MCP liefert Tools; GEPA-Varianten durch vier Geländer plus PR-Review — trotzdem jeden Diff prüfen; SKILL.md nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills einmal installieren für mehrere Editoren; description idealerweise Englisch oder zweisprachig für besseres LLM-Routing.
[ SECTION_08 ] // RUNBOOK Acht-Schritte-Runbook für Hermes Skills und referenzierbare Parameter
- Hermes und Official Skills installieren:
hermes skills install official/research/arxivusw.; Verzeichnis~/.hermes/skills/prüfen. - Erste SKILL.md schreiben: Pflichtfelder
name,description(Use when…), Body mit Procedure und Pitfalls;skills-ref validateausführen. - Skill Bundle anlegen: YAML unter
~/.hermes/skill-bundles/oderhermes bundles create;/bundle-nametesten. - Bedingte Aktivierung konfigurieren: requires/fallback in metadata.hermes; API-Key wechseln und Sichtbarkeit verifizieren.
- Community-Tap abonnieren:
hermes skills tap add github:ChuckSRQ/awesome-hermes-skills, regelmäßigtap update. - Team-Tap veröffentlichen: GitHub-Repo plus skills.sh.json; Mitglieder
tap add; Token für private Repos. - GEPA-Evolution starten: hermes-agent-self-evolution klonen,
evolve_skill --eval-source sessiondb, generiertes PR reviewen. - Remote-Mac 7×24 betreiben:
~/.hermes/auf dedizierten Apple-Silicon-Knoten; Gateway und Skills per Git syncen — kein Laptop-Sleep, der sessiondb unterbricht.
- Level-0-Metadaten: Alle Skills
name+descriptionzusammen ca. 3K Token (Hermes-Doku, Version prüfen). - GEPA-Kosten pro Lauf: ca. 2–10 USD API-only, kein GPU (NousResearch self-evolution).
- GEPA-Größengeländer: Skill ≤15 KB, Tool-Beschreibung ≤500 Zeichen.
- Frontmatter-Limits:
name≤64 Zeichen;description≤1024 Zeichen; Body empfohlen ≤500 Zeilen. - Plattformstandard: agentskills.io-Skills portieren zu Hermes, Claude Code, Cursor, OpenCode — weniger Vendor Lock-in.
Hermes Skills und GEPA brauchen eine Umgebung mit Dauerbetrieb, kontinuierlicher Trace-Persistenz und nativer macOS-Toolchain. Schwächen alternativer Setups: privates MacBook schläft und bricht sessiondb ab; Linux-VPS ohne Xcode/Metal-Skripte; geteilte virtuelle Macs mit instabilen Evaluationsergebnissen durch Multi-Tenant-Konkurrenz. Für iOS-CI/CD, Telegram-Gateway und AI-Agent-Selbstevolution in Produktion liefert NOVAKVM Mac Mini M4/M4 Pro Bare Metal exklusives Apple Silicon, sechs Regionen und flexible Mietdauer — Skills definieren wie, der Remote-Knoten garantiert dass es durchgehend läuft. Details: Mietpreisseite und Hilfezentrum.