2026 Hermes Agent Skills Fortgeschritten:
Von SKILL.md bis GEPA-Selbstevolution und Mac-Cloud-Praxis

Anfang 2026 veröffentlichte Nous Research den Hermes Agent; binnen zwei Monaten überschritt das GitHub-Repo 160.000 Stars. Leitmotiv: „the agent that grows with you“ — der Agent wird mit jeder Nutzung präziser. Träger ist das Skills-System: standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis statt Einmal-Prompt. Dieser Beitrag richtet sich an Entwickler, die Hermes bereits kennen, und deckt SKILL.md-Format, Skill Bundles, bedingte Aktivierung, Tap-Publishing, GEPA+DSPy-Selbstevolution, Plugin-Skills und Open-Source-Ökosystem systematisch ab. Felder und Limits bitte in der Hermes- und agentskills.io-Dokumentation gegenprüfen. Mietpreise: NOVAKVM-Mietpreisseite. EU-Teams, die Ausführungstraces in ~/.hermes/ oder über Cloud-LLM-APIs verarbeiten, sollten Aufbewahrung, Export und Löschung bei Vertragsende in ihre DSGVO-Dokumentation aufnehmen.

  • Token-Explosion: Komplette SOPs im System-Prompt verbrennen bei jedem Turn Tokens; Progressive Disclosure lädt den Skill-Body erst nach Aktivierung.
  • Amnesie über Sitzungen: Normale Prompts gelten nur aktuell; Skills und Memory persistieren — Skills lehren wie, Memory speichert was.
  • Fragmentierte Workflows: PR-Review, TDD und Deploy-Checks in getrennten Chats; Skill Bundles laden per Slash-Befehl das gesamte Set.
  • Fehlende Umgebungswahrnehmung: Mit bezahltem web_search DuckDuckGo-Fallback-Skills zu laden verschwendet Kontext; bedingte Aktivierung blendet Skills nach Tool-Verfügbarkeit aus.
  • Stagnierende Skill-Qualität: Handgeschriebene SKILL.md-Dateien werden selten iteriert; GEPA optimiert Skill-Text aus Ausführungstraces ohne Modell-Fine-Tuning.
  • Kein Team-Sharing: Skills verstreut in persönlichen Ordnern; Tap-Repos plus hermes skills tap add abonnieren eine gemeinsame Quelle.
  • Verwechslung mit MCP: Skills sind prozedurales Wissen, MCP liefert Tool-Schnittstellen — komplementär, nicht austauschbar.

Fünf Leitfragen für Fortgeschrittene: Wie steuert Progressive Disclosure Tokens? Wie konfiguriert man bedingte Aktivierung? Wie triggert ein Bundle den ganzen Workflow? Wie verbessert GEPA Skills über Zeit? Welche Community-Taps lohnen sich? Die folgenden Abschnitte beantworten das der Reihe nach.

Prompt vs Memory vs Skills — dreidimensionale Gegenüberstellung
Dimension Normaler Prompt Memory Skills
Persistenz Aktuelle Sitzung Sitzungsübergreifend, dauerhaft Sitzungsübergreifend, dauerhaft
Ladezeitpunkt Immer im Kontext Pro Sitzung automatisch injiziert On-Demand
Token-Kosten Bei jedem Turn Klein und stabil Body vor Aktivierung: null
Inhaltstyp Beliebige Absicht Präferenzen und Fakten Prozedurale Schritte
Pflege Manuell durch Nutzer Automatisch durch Agent Nutzer und Agent
Teilbarkeit Unbequem Privat Als Community-Tap veröffentlichbar

Merksatz: Prompt = Haftnotiz (gültig jetzt); Memory = Notizblock (dauerhaft griffbereit); Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geöffnet).

Alle Hermes Skills folgen dem offenen Standard agentskills.io und portieren zwischen Hermes, Claude Code und Cursor. Empfohlene Verzeichnisstruktur:

~/.hermes/skills/my-category/my-skill/
SKILL.md
references/
templates/
scripts/

Hauptdatei SKILL.md idealerweise ≤500 Zeilen; references/ für API-Docs, templates/ für wiederverwendbare Vorlagen, scripts/ für direkt ausführbare Skripte.

SKILL.md Frontmatter-Beispiel
---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

Progressive Disclosure ist der Token-Hebel:

Stufen der progressiven Enthüllung
Stufe Inhalt Trigger Token-Kosten
Level 0 name + description Sitzungsstart, Scan aller Skills Alle Skills zusammen ca. 3K
Level 1 Vollständiger SKILL.md-Body /skill-name oder LLM-Entscheid Abhängig von Dateilänge
Level 2 references/, scripts/ Bei Ausführung nach LLM-Entscheid Pro Datei on-demand

Der Body sollte Overview, When to Use, Procedure, Common Pitfalls, Verification Checklist enthalten. Entscheidend: description ist die einzige Level-0-Routing-Info — „wann nutzen“ schlägt „was ist es“. Beginnen Sie mit „Use when…“, max. 1024 Zeichen; name nur Kleinbuchstaben und Bindestriche, max. 64 Zeichen.

Skill Bundles (Neuheit 2026) bündeln mehrere Skills als Slash-Befehl; bei /bundle-name werden gelistete Skills gleichzeitig geladen. Datei unter ~/.hermes/skill-bundles/<slug>.yaml:

backend-dev.yaml
name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

Beispiele: research-session mit arxiv, deep-research, plan, excalidraw; mlops-deploy mit vllm, llama-cpp, github-pr-workflow, systematic-debugging. Regeln: Bei Namenskollision gewinnt das Bundle; fehlende Skills werden übersprungen und gemeldet; keine Änderung am System-Prompt — Prompt-Cache-freundlich. Schnellanlage per CLI:

terminal
hermes bundles create backend-dev \
    --skills github-code-review,test-driven-development,github-pr-workflow \
    --instruction "Always write failing tests first"

Bedingte Aktivierung unter metadata.hermes steuert Sichtbarkeit nach Tool-Verfügbarkeit:

  • requires_toolsets / requires_tools: Skill ausblenden, wenn genannte Tools fehlen.
  • fallback_for_toolsets / fallback_for_tools: Skill ausblenden, wenn genannte Tools vorhanden sind (Fallback-Rolle).

Klassisches Szenario: Mit FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich bezahltes web_search; duckduckgo-search verschwindet dank fallback_for_tools: [web_search]. Fällt die API aus, taucht der Fallback wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] und platforms: [telegram, discord]; die TUI hermes skills schaltet Skills pro CLI, Telegram und Discord separat.

hermes skills Installationsbefehle
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
Beachtenswerte Open-Source-Skill-Repos (Star-Zahlen nach Release erneut prüfen)
Repository Schwerpunkt
ChuckSRQ/awesome-hermes-skills Produktionsreife Sammlung: Deep Research, MLOps, Apple-Integration; 23 Skills für GitHub Copilot
amanning3390/hermeshub Community-Registry mit Security-Scan, API und Marktplatz
kevinnft/ai-agent-skills 191 Skills in 28 Kategorien, portabel für Hermes/Claude Code/Cursor
NousResearch/hermes-agent Offizielle Quelle mit allen Built-in-Skills und Authoring-Spec

Skill Tap veröffentlichen: GitHub-Repo als Skill-Quelle anlegen, Team führt hermes skills tap add github:your-org/your-skills-tap aus; private Repos mit --token $GH_TOKEN; Updates via hermes skills tap update. Optional skills.sh.json für Hub-Kategorien. ~/.hermes/skills/ per Git versionieren für Gerätesync; danach hermes skills reset für Built-ins. Der agentskills.io-Standard entkoppelt Assets von einer Plattform — Validierung mit skills-ref validate ./my-skill.

Offizielle Einstiegspunkte — nach jedem Upstream-Release Links erneut öffnen:

Hermes Agent Skills — Benutzerdokumentation

Creating Skills — Entwicklerleitfaden

agentskills.io — offizielle Spezifikation

hermes-agent-self-evolution (GEPA-Tool-Repo)

GEPA (Genetic-Pareto Prompt Evolution), ICLR 2026 Oral, lebt in hermes-agent-self-evolution. Ablauf: Ausführungstraces analysieren → Varianten erzeugen → multiobjektive Pareto-Optimierung → SKILL.md-Text verbessern, ohne Fine-Tuning. Kosten pro Lauf typisch 2–10 USD reine API, kein GPU nötig.

Fünf Phasen: ① Trace-Sammlung (SQLite, vollständige Reasoning-Pfade) → ② reflexive Fehleranalyse (handlungsrelevante Side-Information) → ③ gezielte Mutation (10–20 SKILL.md-Varianten pro Failure) → ④ Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit) → ⑤ menschliches PR-Review (beste Variante live).

evolve_skill Schnellstart
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
        --skill github-code-review \
        --iterations 10 \
        --eval-source sessiondb

Vier Sicherheitsgeländer: Volllauf-Tests 100 % grün; Skills ≤15 KB, Tool-Beschreibungen ≤500 Zeichen; Prompt Cache unverändert; semantische Treue zum ursprünglichen Zweck. Roadmap: Phase 1 Skill-Dateien (✅) → Phase 2 Tool-Beschreibungen → Phase 3 System-Prompt → Phase 4 Tool-Implementierung → Phase 5 vollautomatischer Loop. Dank agentskills.io können Claude-Code- oder Gemini-CLI-Traces mitgefüttert werden: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions. Enthalten Traces personenbezogene Inhalte, Löschfristen und Zugriffskontrolle DSGVO-konform dokumentieren.

Plugin-Bundled Skills laden über Namespace plugin:skill, erscheinen nicht in der Standard-skills_list und aktivieren nur bei explizitem Aufruf; Skills desselben Plugins können sich gegenseitig wahrnehmen. In plugin.yaml den skills-Pfad deklarieren.

Authoring aus Engineer-Sicht:

  • description bestimmt Treffgenauigkeit: „Use when reviewing a pull request…Do NOT use for writing new code“ statt „Helps with code“.
  • Pitfalls als Qualitätsgrenze: konkrete Failure-Modes, Ursache und Fix (fragile CSS-Selektoren, GitHub-Rate-Limits, große Diffs).
  • Skripte einbinden: Procedure verweist auf scripts/extract_schema.py; bei Fehler references/manual-extract.md nachladen.
  • Größenkontrolle: <500 Zeilen in SKILL.md; 500–1000 in references; >15 KB zwingend splitten (GEPA-Limit).
  • skill_manage: Agent nutzt action='patch'|'create'; in config.yaml agent_writes_require_approval: true für menschliches Gate.

Blog-Workflow-Case: Bundle blog-workflow mit seo-keyword-research, outline-generator, code-example-validator, bilingual-checker, publish-to-platform; Instruction verlangt SEO-Recherche, lauffähige Code-Beispiele, zweisprachige Titel. Nach Skill-Änderung in der laufenden Sitzung: /reset oder Installation mit --now (invalidiert Prompt Cache).

FAQ: Skills lehren Prozesse, MCP liefert Tools; GEPA-Varianten durch vier Geländer plus PR-Review — trotzdem jeden Diff prüfen; SKILL.md nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills einmal installieren für mehrere Editoren; description idealerweise Englisch oder zweisprachig für besseres LLM-Routing.

  1. Hermes und Official Skills installieren: hermes skills install official/research/arxiv usw.; Verzeichnis ~/.hermes/skills/ prüfen.
  2. Erste SKILL.md schreiben: Pflichtfelder name, description (Use when…), Body mit Procedure und Pitfalls; skills-ref validate ausführen.
  3. Skill Bundle anlegen: YAML unter ~/.hermes/skill-bundles/ oder hermes bundles create; /bundle-name testen.
  4. Bedingte Aktivierung konfigurieren: requires/fallback in metadata.hermes; API-Key wechseln und Sichtbarkeit verifizieren.
  5. Community-Tap abonnieren: hermes skills tap add github:ChuckSRQ/awesome-hermes-skills, regelmäßig tap update.
  6. Team-Tap veröffentlichen: GitHub-Repo plus skills.sh.json; Mitglieder tap add; Token für private Repos.
  7. GEPA-Evolution starten: hermes-agent-self-evolution klonen, evolve_skill --eval-source sessiondb, generiertes PR reviewen.
  8. Remote-Mac 7×24 betreiben: ~/.hermes/ auf dedizierten Apple-Silicon-Knoten; Gateway und Skills per Git syncen — kein Laptop-Sleep, der sessiondb unterbricht.
  • Level-0-Metadaten: Alle Skills name+description zusammen ca. 3K Token (Hermes-Doku, Version prüfen).
  • GEPA-Kosten pro Lauf: ca. 2–10 USD API-only, kein GPU (NousResearch self-evolution).
  • GEPA-Größengeländer: Skill ≤15 KB, Tool-Beschreibung ≤500 Zeichen.
  • Frontmatter-Limits: name ≤64 Zeichen; description ≤1024 Zeichen; Body empfohlen ≤500 Zeilen.
  • Plattformstandard: agentskills.io-Skills portieren zu Hermes, Claude Code, Cursor, OpenCode — weniger Vendor Lock-in.

Hermes Skills und GEPA brauchen eine Umgebung mit Dauerbetrieb, kontinuierlicher Trace-Persistenz und nativer macOS-Toolchain. Schwächen alternativer Setups: privates MacBook schläft und bricht sessiondb ab; Linux-VPS ohne Xcode/Metal-Skripte; geteilte virtuelle Macs mit instabilen Evaluationsergebnissen durch Multi-Tenant-Konkurrenz. Für iOS-CI/CD, Telegram-Gateway und AI-Agent-Selbstevolution in Produktion liefert NOVAKVM Mac Mini M4/M4 Pro Bare Metal exklusives Apple Silicon, sechs Regionen und flexible Mietdauer — Skills definieren wie, der Remote-Knoten garantiert dass es durchgehend läuft. Details: Mietpreisseite und Hilfezentrum.