OpenRouter Wochen-Rankings:
Rechnungsdaten lügen nicht — wer dominiert wirklich?

Wer Mitte 2026 noch MMLU- oder HumanEval-Tabellen als einzige Modellauswahl nutzt, übersieht oft das Entscheidende: wie viele Token Entwickler pro Woche tatsächlich verbrennen. In Agent-Batch-Jobs und Coding-Pipelines landet man sonst beim Modell mit Prüfungsspitzenwerten und explodierender Rechnung. Dieser Beitrag nutzt OpenRouter-Wochenstatistiken (7-Tage-Rolling) als Datenanker für die Woche 18. bis 24. Mai 2026: 28,9 Billionen Token weltweit, DeepSeek-V4-Flash mit +66 % Wachstum an der Spitze, chinesische Modelle vier Wochen in Folge vor US-Anbietern sowie das Anthropic-Prämien-Paradox — hoher Dollar-Umsatz bei sinkendem Token-Anteil. Sie erhalten ein Sechs-Schritte-Runbook, um öffentliche Rankings in API-Routing zu übersetzen. Preise und Regionen: NOVAKVM-Mietpreisseite, Bestellung: Bestellseite.

OpenRouter gehört zu den größten neutralen API-Aggregatoren: über 300 Modelle, mehr als 60 Anbieter, öffentliche Wochen-Rankings nach Token-Durchsatz. Anders als Hersteller-Benchmarks misst Token-Volumen, wofür Teams dauerhaft zahlen oder dauerhaft routen — ein Thermometer für Marktakzeptanz und Produktionsreife.

  • Benchmark-Blindspot: Statische Tests optimieren Einzelantworten; in Produktion laufen Agenten tausende Tool-Calls — Preis × Durchsatz × Stabilität ist die Rechnungswahrheit.
  • Launch-Narrative hinkt hinterher: Neue Modelle erscheinen auf OpenRouter oft innerhalb weniger Tage in den Wochenzahlen — schneller als Medien-Überschriften zum „stärksten Modell“.
  • China-USA-Umkehr: Anfang 2025 unter 2 % chinesischer Traffic-Anteil; Mai 2026 über 45 %, vier Wochen hintereinander mehr Wochen-Tokens als die USA.
  • Umsatz-Traffic-Divergenz: Anthropic etwa 12 % Token-Anteil (vor einem Jahr ~25 %), aber weiterhin ~46 % Dollar-Umsatzanteil auf der Plattform.
  • Programmierung dominiert: OpenRouter und a16z (anonymisierte Metadaten, ~100 Billionen Token) zeigen Coding-Anteile von ~11 % Anfang 2025 auf über 50 % — wichtigster Einzelfaktor beim Lesen der Top-10.
  • Host wird unterschätzt: Selbst optimales Routing scheitert, wenn das Gateway nach Zuklappen des Laptops abbricht — dann hilft kein günstiges Top-Modell für Langzeit-Agenten.

Cloud-APIs verarbeiten Prompts auf Anbieter-Infrastruktur, oft mit US-Transit. Für EU-Teams mit personenbezogenen Daten, Kundencode oder Gesundheitskontexten gilt vor Serienbetrieb: DSGVO-konforme Auftragsverarbeitung (AVV), Datenstandort, Subprozessor-Liste und Löschfristen mit Legal klären. Kostenlose oder Stealth-Modelle können Prompts zur Produktverbesserung speichern — dann ist On-Premise oder ein Enterprise-Vertrag oft die sauberere Wahl.

OpenRouter-Rankings und Messlogik bitte vor Integration auf der Plattform erneut prüfen.

https://openrouter.ai/rankings

In dieser Woche summierten sich globale API-Aufrufe auf 28,9 Billionen Token (Input + Output), +7,4 % zum Vorwoche, fünfte Steigerung in Folge. Vor einem Jahr lag das Wochenvolumen bei etwa 2,4 Billionen — rund 12-faches Wachstum in zwölf Monaten, typisch für skalierte Agent- und Batch-Inferenz.

Globale Wochenkennzahlen (2026-05-18 bis 2026-05-24)
Kennzahl Wert WoW
Globales Wochen-Token-Volumen 28,9 Billionen +7,4 %
Chinesische Modelle 9,223 Billionen +19,89 %
US-Modelle 4,93 Billionen +16,27 %
China vs. USA China 4. Woche in Folge #1 Anteil wächst
OpenRouter Top 10 nach Wochen-Tokens (Stand 2026-05-24)
Rang Modell Anbieter Wochen-Tokens WoW / Merkmal
1 DeepSeek-V4-Flash DeepSeek 3,43T +66 %; Agent-Workflows, extrem niedriger Preis
2 Tencent Hy3 Preview Tencent 3,07T +16 %; Wachstum nach Gratis-Phase
3 Claude Sonnet 4.6 Anthropic 1,35T 1M Kontext, Enterprise-Coding
4 DeepSeek-V3.2 DeepSeek 1,31T Günstiges Long-Tail, Rollenspiel aktiv
5 Owl Alpha OpenRouter 1,15T +29 %; kostenloser Agent-Fokus
6 Gemini 3 Flash Preview Google 1,06T Multimodal, Akademie und Medizin
7 DeepSeek-V4-Pro DeepSeek 1,00T Serie gesamt ~5,74T
8 MiniMax M2.7 MiniMax 806B Langer Kontext, Preis-Leistung
9 Grok 4.1 Fast xAI 721B 2M Kontext, Rechtsszenarien
10 Step 3.5 Flash StepFun 673B Schnell und günstig, Batch

DeepSeek platzierte V4-Flash, V4-Pro und V3.2 gleichzeitig in der Spitzengruppe — Seriensumme etwa 5,74 Billionen Token (+25,9 % WoW), zwei Wochen in Folge vor Anthropic und Google auf Anbieter-Ebene. Kimi K2.6 fiel aus den Top 10; monatliche Reviews verpassen solche Routing-Fenster.

Ausgegebene Euro lügen nicht: Wochen-Tokens messen nicht „Intelligenz“, sondern „wiederholte Nutzung in breiten Engineering-Szenarien“.

Marktsegmente: Traffic, Preis und typische Nutzer (Mai 2026)
Segment Beispiel Token-Profil Typische Nutzer
Hoher Wert, wenig Traffic Claude Opus-Serie Hoher Stückpreis, wenig Wochen-Tokens vs. DeepSeek Enterprise-Reasoning, starke Zahlungsbereitschaft
Preis-Leistung, mittlerer Traffic Gemini 3 Flash Multimodal ausgewogen, ~1T/Woche Akademie, Medizin, Google-Ökosystem
Extrem günstig, hoher Traffic DeepSeek / Hy3 / MiniMax / StepFun 0,6T–3,4T/Woche, treibt globales Wachstum Agent, Coding, Batch-Inferenz

Der OpenRouter-a16z-Bericht „AI Usage 2025“ betont: Benchmark-Scores und Marktanteil korrelieren oft invers. Teams priorisieren Inferenzkosten, API-Latenz und Tool-Call-Stabilität über einstellige Score-Differenzen. „Standardmäßig das stärkste Modell“ ist in Agent-Pipelines häufig die falsche Default-Option.

Anthropics Spannungsfeld: Enterprise-Kunden zahlen weiter Prämie für Claude (Dollar-Anteil ~46 %), während Open Source und Ultra-Low-Cost den Großteil neuer Tokens absorbieren. DeepSeek kündigte am 22. Mai 2026 an, V4-Pro dauerhaft auf ein Viertel des Ursprungspreises zu setzen — Preisvorteil wird Struktur, nicht nur Promotion.

Für deutsche Engineering-Leads bedeutet das eine klare Metrik-Trennung: Token-Ranking zeigt, wohin die Masse fließt; Dollar-Konzentration zeigt, wo noch Enterprise-Budgets hängen. Beides zusammen entscheidet, ob Sie Hy3 für interne Experimente freigeben, Sonnet für Compliance-Pfade reservieren und V4-Flash als Default für CI-Agenten setzen — jeweils mit dokumentierter DSGVO-Bewertung pro Key.

Praktisch heißt das: ein wöchentlicher Export aus OpenRouter plus ein internes Spreadsheet mit Modell, Datenklasse und AVV-Status reicht oft aus, um Architekturentscheidungen zu beschleunigen. Teams, die nur quartalsweise Benchmarks lesen, verpassen typischerweise zwei bis drei Routing-Umschwünge pro Halbjahr — in einer Marktphase, in der Kimi K2.6 innerhalb einer Woche aus den Top 10 fällt und Owl Alpha mit +29 % nachrückt.

  1. Fester Wochenrhythmus: Montags openrouter.ai/rankings öffnen; globales Volumen, China-USA-Anteile und Top-10-Änderungen protokollieren; mit interner Rechnung WoW vergleichen.
  2. Aufgaben-Tier-Routing: Agent und Batch standardmäßig DeepSeek-V4-Flash oder aktuelles Top-3-Günstigmodell; komplexe Enterprise-Reasoning-Pfade isoliert auf Claude Sonnet/Opus.
  3. Neue Top-10-Einträge beobachten: Hy3 Preview, Owl Alpha mit WoW >20 % oft Vorboten des nächsten Defaults — 5 % Graustufen-Traffic testen.
  4. Token vs. Euro trennen: OpenRouter-Konsole: Token-Menge und Abbuchung je Modell; hohe Euro-Konzentration bei niedrigem Token-Anteil signalisiert zu viele Premium-Keys.
  5. Interne Erfolgsrate: Golden Issues gegen Top-Ranking- und Backup-Modelle; globales Ranking garantiert nicht Repo-Optimum.
  6. Stabiler Agent-Host: Gateway, Node und Logs auf Remote-Mac Mini M4/M4 Pro fixieren; Modellwechsel nur per Env-Var. SSH-Baseline: Hilfezentrum.
weekly-rankings-check.sh
DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
  | mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"

Für deutsche Teams empfiehlt sich ein internes Wiki-Eintrag pro OpenRouter-Key: Datenklasse (öffentlich, intern, personenbezogen), AVV-Status und Wochenbudget. Hoher Token-Anteil bei Hy3 oder V4-Flash bedeutet nicht automatisch DSGVO-konforme Verarbeitung — Subprozessor-Kette und Transit-Land müssen pro Key bewertet werden, unabhängig vom Ranking-Platz.

  • Globales Wochenvolumen: 28,9 Billionen Token, +7,4 % WoW, fünfte Steigerung; vor einem Jahr ~2,4T/Woche, ~12× in zwölf Monaten.
  • DeepSeek-V4-Flash: 3,43 Billionen Token, +66 % WoW; MoE ~284B gesamt / 13B aktiv; OpenRouter ca. $0,14 / Mio. Input, $0,28 / Mio. Output (Seiten können angepasst werden).
  • DeepSeek-Serie gesamt: 5,74 Billionen Token (V4-Flash + V4-Pro + V3.2), Anbieter zwei Wochen #1.
  • Anthropic-Paradox: ~12 % Token vs. ~46 % Dollar-Umsatz; Claude Opus 4.6 Medienberichte ~25 Mio. USD/Monat, Wochen-Tokens weit unter DeepSeek-Einzelmodell.
  • Coding-Anteil: von ~11 % Anfang 2025 auf über 50 % — primärer Kontext für die Top-10-Lesart.

DeepSeek V4 Flash Modellseite und OpenRouter-Rankings vor Anbindung erneut prüfen.

https://openrouter.ai/deepseek/deepseek-v4-flash

https://openrouter.ai/rankings

Die OpenRouter-Daten der Mai-Woche 2026 sind eindeutig: Der Markt stimmt mit Geld ab. Chinesische Open-Source-Modelle formen das globale Routing mit extrem niedrigen Kosten; entscheidend ist nicht der höchste Benchmark, sondern wiederholte Nutzung in breiten Engineering-Szenarien. Investoren, Entwickler und Medien nutzen Wochen-Token-Rankings zunehmend als Live-Scoreboard — näher an der Realität als statische „stärkste Modell“-Listen.

Wer nur wöchentlich die Tabelle aktualisiert, Agenten aber auf schlafenden Laptops, ungeplanten VPS oder instabilem SSH betreibt, verwandelt DeepSeek-V4-Flashes +66 % nicht in höhere PR-Merge-Raten. Typische Bremsen: Gateway-Abbruch beim Zuklappen, volle Platte bei OpenClaw-Upgrades, Tool-Call-Timeouts durch Netzjitter — unsichtbar im Ranking, sichtbar in der Erfolgsrate.

Für iOS/macOS-CI, OpenClaw 7×24 oder Claude Code Remote mit Gateway lohnt neben wöchentlichem API-Tuning die Migration auf exklusives Apple-Silicon-Bare-Metal oft mehr als blindes Ranking-Chasing. NOVAKVM bietet Mac Mini M4 / M4 Pro in mehreren Regionen mit flexiblen Mietzeiträumen. Pakete: Mietpreisseite, Bestellung: Bestellseite, Remote-Baseline: Hilfezentrum.