2026 Hermes Agent Skills Fortgeschritten: Von SKILL.md bis GEPA-Selbstevolution und Mac-Cloud-Praxis // NOVAKVM Engineering Blog

Anfang 2026 veröffentlichte Nous Research den Hermes Agent; binnen zwei Monaten überschritt das GitHub-Repo 160.000 Stars. Leitmotiv: „the agent that grows with you“ — der Agent wird mit jeder Nutzung präziser. Träger ist das Skills-System: standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis statt Einmal-Prompt. Dieser Beitrag richtet sich an Entwickler, die Hermes bereits kennen, und deckt SKILL.md-Format, Skill Bundles, bedingte Aktivierung, Tap-Publishing, GEPA+DSPy-Selbstevolution, Plugin-Skills und Open-Source-Ökosystem systematisch ab. Felder und Limits bitte in der Hermes- und agentskills.io-Dokumentation gegenprüfen. Mietpreise: NOVAKVM-Mietpreisseite. EU-Teams, die Ausführungstraces in ~/.hermes/ oder über Cloud-LLM-APIs verarbeiten, sollten Aufbewahrung, Export und Löschung bei Vertragsende in ihre DSGVO-Dokumentation aufnehmen.

[ SECTION_01 ] // PAIN_MAP Warum sich das Hermes-Skills-System einer vertieften Analyse lohnt

Token-Explosion: Komplette SOPs im System-Prompt verbrennen bei jedem Turn Tokens; Progressive Disclosure lädt den Skill-Body erst nach Aktivierung.
Amnesie über Sitzungen: Normale Prompts gelten nur aktuell; Skills und Memory persistieren — Skills lehren wie, Memory speichert was.
Fragmentierte Workflows: PR-Review, TDD und Deploy-Checks in getrennten Chats; Skill Bundles laden per Slash-Befehl das gesamte Set.
Fehlende Umgebungswahrnehmung: Mit bezahltem web_search DuckDuckGo-Fallback-Skills zu laden verschwendet Kontext; bedingte Aktivierung blendet Skills nach Tool-Verfügbarkeit aus.
Stagnierende Skill-Qualität: Handgeschriebene SKILL.md-Dateien werden selten iteriert; GEPA optimiert Skill-Text aus Ausführungstraces ohne Modell-Fine-Tuning.
Kein Team-Sharing: Skills verstreut in persönlichen Ordnern; Tap-Repos plus hermes skills tap add abonnieren eine gemeinsame Quelle.
Verwechslung mit MCP: Skills sind prozedurales Wissen, MCP liefert Tool-Schnittstellen — komplementär, nicht austauschbar.

Fünf Leitfragen für Fortgeschrittene: Wie steuert Progressive Disclosure Tokens? Wie konfiguriert man bedingte Aktivierung? Wie triggert ein Bundle den ganzen Workflow? Wie verbessert GEPA Skills über Zeit? Welche Community-Taps lohnen sich? Die folgenden Abschnitte beantworten das der Reihe nach.

[ SECTION_02 ] // MATRIX Hermes Skills, Memory und normaler Prompt — wo liegt der Unterschied?

Prompt vs Memory vs Skills — dreidimensionale Gegenüberstellung
Dimension	Normaler Prompt	Memory	Skills
Persistenz	Aktuelle Sitzung	Sitzungsübergreifend, dauerhaft	Sitzungsübergreifend, dauerhaft
Ladezeitpunkt	Immer im Kontext	Pro Sitzung automatisch injiziert	On-Demand
Token-Kosten	Bei jedem Turn	Klein und stabil	Body vor Aktivierung: null
Inhaltstyp	Beliebige Absicht	Präferenzen und Fakten	Prozedurale Schritte
Pflege	Manuell durch Nutzer	Automatisch durch Agent	Nutzer und Agent
Teilbarkeit	Unbequem	Privat	Als Community-Tap veröffentlichbar

Merksatz: Prompt = Haftnotiz (gültig jetzt); Memory = Notizblock (dauerhaft griffbereit); Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geöffnet).

[ SECTION_03 ] // STRUCTURE SKILL.md im Detail und Progressive Disclosure in drei Stufen

Alle Hermes Skills folgen dem offenen Standard agentskills.io und portieren zwischen Hermes, Claude Code und Cursor. Empfohlene Verzeichnisstruktur:

~/.hermes/skills/my-category/my-skill/

SKILL.md
references/
templates/
scripts/

Hauptdatei SKILL.md idealerweise ≤500 Zeilen; references/ für API-Docs, templates/ für wiederverwendbare Vorlagen, scripts/ für direkt ausführbare Skripte.

SKILL.md Frontmatter-Beispiel

---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

Progressive Disclosure ist der Token-Hebel:

Stufen der progressiven Enthüllung
Stufe	Inhalt	Trigger	Token-Kosten
Level 0	`name` + `description`	Sitzungsstart, Scan aller Skills	Alle Skills zusammen ca. 3K
Level 1	Vollständiger SKILL.md-Body	`/skill-name` oder LLM-Entscheid	Abhängig von Dateilänge
Level 2	`references/`, `scripts/`	Bei Ausführung nach LLM-Entscheid	Pro Datei on-demand

Der Body sollte Overview, When to Use, Procedure, Common Pitfalls, Verification Checklist enthalten. Entscheidend: description ist die einzige Level-0-Routing-Info — „wann nutzen“ schlägt „was ist es“. Beginnen Sie mit „Use when…“, max. 1024 Zeichen; name nur Kleinbuchstaben und Bindestriche, max. 64 Zeichen.

[ SECTION_04 ] // WORKFLOW Skill Bundles und bedingte Aktivierung: ein Befehl, ganzer Workflow

Skill Bundles (Neuheit 2026) bündeln mehrere Skills als Slash-Befehl; bei /bundle-name werden gelistete Skills gleichzeitig geladen. Datei unter ~/.hermes/skill-bundles/<slug>.yaml:

backend-dev.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

Beispiele: research-session mit arxiv, deep-research, plan, excalidraw; mlops-deploy mit vllm, llama-cpp, github-pr-workflow, systematic-debugging. Regeln: Bei Namenskollision gewinnt das Bundle; fehlende Skills werden übersprungen und gemeldet; keine Änderung am System-Prompt — Prompt-Cache-freundlich. Schnellanlage per CLI:

terminal

hermes bundles create backend-dev \
    --skills github-code-review,test-driven-development,github-pr-workflow \
    --instruction "Always write failing tests first"

Bedingte Aktivierung unter metadata.hermes steuert Sichtbarkeit nach Tool-Verfügbarkeit:

requires_toolsets / requires_tools: Skill ausblenden, wenn genannte Tools fehlen.
fallback_for_toolsets / fallback_for_tools: Skill ausblenden, wenn genannte Tools vorhanden sind (Fallback-Rolle).

Klassisches Szenario: Mit FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich bezahltes web_search; duckduckgo-search verschwindet dank fallback_for_tools: [web_search]. Fällt die API aus, taucht der Fallback wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] und platforms: [telegram, discord]; die TUI hermes skills schaltet Skills pro CLI, Telegram und Discord separat.

[ SECTION_05 ] // ECOSYSTEM Skills Hub, Open-Source-Ökosystem und eigenes Skill Tap veröffentlichen

hermes skills Installationsbefehle

hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills

Beachtenswerte Open-Source-Skill-Repos (Star-Zahlen nach Release erneut prüfen)
Repository	Schwerpunkt
ChuckSRQ/awesome-hermes-skills	Produktionsreife Sammlung: Deep Research, MLOps, Apple-Integration; 23 Skills für GitHub Copilot
amanning3390/hermeshub	Community-Registry mit Security-Scan, API und Marktplatz
kevinnft/ai-agent-skills	191 Skills in 28 Kategorien, portabel für Hermes/Claude Code/Cursor
NousResearch/hermes-agent	Offizielle Quelle mit allen Built-in-Skills und Authoring-Spec

Skill Tap veröffentlichen: GitHub-Repo als Skill-Quelle anlegen, Team führt hermes skills tap add github:your-org/your-skills-tap aus; private Repos mit --token $GH_TOKEN; Updates via hermes skills tap update. Optional skills.sh.json für Hub-Kategorien. ~/.hermes/skills/ per Git versionieren für Gerätesync; danach hermes skills reset für Built-ins. Der agentskills.io-Standard entkoppelt Assets von einer Plattform — Validierung mit skills-ref validate ./my-skill.

Offizielle Einstiegspunkte — nach jedem Upstream-Release Links erneut öffnen:

Hermes Agent Skills — Benutzerdokumentation

Creating Skills — Entwicklerleitfaden

agentskills.io — offizielle Spezifikation

hermes-agent-self-evolution (GEPA-Tool-Repo)

[ SECTION_06 ] // EVOLUTION GEPA + DSPy: Skills automatisch verbessern, ohne Modellgewichte anzufassen

GEPA (Genetic-Pareto Prompt Evolution), ICLR 2026 Oral, lebt in hermes-agent-self-evolution. Ablauf: Ausführungstraces analysieren → Varianten erzeugen → multiobjektive Pareto-Optimierung → SKILL.md-Text verbessern, ohne Fine-Tuning. Kosten pro Lauf typisch 2–10 USD reine API, kein GPU nötig.

Fünf Phasen: ① Trace-Sammlung (SQLite, vollständige Reasoning-Pfade) → ② reflexive Fehleranalyse (handlungsrelevante Side-Information) → ③ gezielte Mutation (10–20 SKILL.md-Varianten pro Failure) → ④ Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit) → ⑤ menschliches PR-Review (beste Variante live).

evolve_skill Schnellstart

export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
        --skill github-code-review \
        --iterations 10 \
        --eval-source sessiondb

Vier Sicherheitsgeländer: Volllauf-Tests 100 % grün; Skills ≤15 KB, Tool-Beschreibungen ≤500 Zeichen; Prompt Cache unverändert; semantische Treue zum ursprünglichen Zweck. Roadmap: Phase 1 Skill-Dateien (✅) → Phase 2 Tool-Beschreibungen → Phase 3 System-Prompt → Phase 4 Tool-Implementierung → Phase 5 vollautomatischer Loop. Dank agentskills.io können Claude-Code- oder Gemini-CLI-Traces mitgefüttert werden: --eval-source mixed --trace-dirs ~/.claude/traces,~/.hermes/sessions. Enthalten Traces personenbezogene Inhalte, Löschfristen und Zugriffskontrolle DSGVO-konform dokumentieren.

[ SECTION_07 ] // ADVANCED Plugin-Skills, fortgeschrittenes Authoring und Blog-Workflow-Praxis

Plugin-Bundled Skills laden über Namespace plugin:skill, erscheinen nicht in der Standard-skills_list und aktivieren nur bei explizitem Aufruf; Skills desselben Plugins können sich gegenseitig wahrnehmen. In plugin.yaml den skills-Pfad deklarieren.

Authoring aus Engineer-Sicht:

description bestimmt Treffgenauigkeit: „Use when reviewing a pull request…Do NOT use for writing new code“ statt „Helps with code“.
Pitfalls als Qualitätsgrenze: konkrete Failure-Modes, Ursache und Fix (fragile CSS-Selektoren, GitHub-Rate-Limits, große Diffs).
Skripte einbinden: Procedure verweist auf scripts/extract_schema.py; bei Fehler references/manual-extract.md nachladen.
Größenkontrolle: <500 Zeilen in SKILL.md; 500–1000 in references; >15 KB zwingend splitten (GEPA-Limit).
skill_manage: Agent nutzt action='patch'|'create'; in config.yaml agent_writes_require_approval: true für menschliches Gate.

Blog-Workflow-Case: Bundle blog-workflow mit seo-keyword-research, outline-generator, code-example-validator, bilingual-checker, publish-to-platform; Instruction verlangt SEO-Recherche, lauffähige Code-Beispiele, zweisprachige Titel. Nach Skill-Änderung in der laufenden Sitzung: /reset oder Installation mit --now (invalidiert Prompt Cache).

FAQ: Skills lehren Prozesse, MCP liefert Tools; GEPA-Varianten durch vier Geländer plus PR-Review — trotzdem jeden Diff prüfen; SKILL.md nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills einmal installieren für mehrere Editoren; description idealerweise Englisch oder zweisprachig für besseres LLM-Routing.

[ SECTION_08 ] // RUNBOOK Acht-Schritte-Runbook für Hermes Skills und referenzierbare Parameter

Hermes und Official Skills installieren: hermes skills install official/research/arxiv usw.; Verzeichnis ~/.hermes/skills/ prüfen.
Erste SKILL.md schreiben: Pflichtfelder name, description (Use when…), Body mit Procedure und Pitfalls; skills-ref validate ausführen.
Skill Bundle anlegen: YAML unter ~/.hermes/skill-bundles/ oder hermes bundles create; /bundle-name testen.
Bedingte Aktivierung konfigurieren: requires/fallback in metadata.hermes; API-Key wechseln und Sichtbarkeit verifizieren.
Community-Tap abonnieren: hermes skills tap add github:ChuckSRQ/awesome-hermes-skills, regelmäßig tap update.
Team-Tap veröffentlichen: GitHub-Repo plus skills.sh.json; Mitglieder tap add; Token für private Repos.
GEPA-Evolution starten: hermes-agent-self-evolution klonen, evolve_skill --eval-source sessiondb, generiertes PR reviewen.
Remote-Mac 7×24 betreiben: ~/.hermes/ auf dedizierten Apple-Silicon-Knoten; Gateway und Skills per Git syncen — kein Laptop-Sleep, der sessiondb unterbricht.

Level-0-Metadaten: Alle Skills name+description zusammen ca. 3K Token (Hermes-Doku, Version prüfen).
GEPA-Kosten pro Lauf: ca. 2–10 USD API-only, kein GPU (NousResearch self-evolution).
GEPA-Größengeländer: Skill ≤15 KB, Tool-Beschreibung ≤500 Zeichen.
Frontmatter-Limits: name ≤64 Zeichen; description ≤1024 Zeichen; Body empfohlen ≤500 Zeilen.
Plattformstandard: agentskills.io-Skills portieren zu Hermes, Claude Code, Cursor, OpenCode — weniger Vendor Lock-in.

Hermes Skills und GEPA brauchen eine Umgebung mit Dauerbetrieb, kontinuierlicher Trace-Persistenz und nativer macOS-Toolchain. Schwächen alternativer Setups: privates MacBook schläft und bricht sessiondb ab; Linux-VPS ohne Xcode/Metal-Skripte; geteilte virtuelle Macs mit instabilen Evaluationsergebnissen durch Multi-Tenant-Konkurrenz. Für iOS-CI/CD, Telegram-Gateway und AI-Agent-Selbstevolution in Produktion liefert NOVAKVM Mac Mini M4/M4 Pro Bare Metal exklusives Apple Silicon, sechs Regionen und flexible Mietdauer — Skills definieren wie, der Remote-Knoten garantiert dass es durchgehend läuft. Details: Mietpreisseite und Hilfezentrum.

2026 Hermes Agent Skills Fortgeschritten:Von SKILL.md bis GEPA-Selbstevolution und Mac-Cloud-Praxis