OpenRouter Wochen-Rankings: Rechnungsdaten lügen nicht — wer dominiert wirklich? // NOVAKVM Engineering Blog

Wer Mitte 2026 noch MMLU- oder HumanEval-Tabellen als einzige Modellauswahl nutzt, übersieht oft das Entscheidende: wie viele Token Entwickler pro Woche tatsächlich verbrennen. In Agent-Batch-Jobs und Coding-Pipelines landet man sonst beim Modell mit Prüfungsspitzenwerten und explodierender Rechnung. Dieser Beitrag nutzt OpenRouter-Wochenstatistiken (7-Tage-Rolling) als Datenanker für die Woche 18. bis 24. Mai 2026: 28,9 Billionen Token weltweit, DeepSeek-V4-Flash mit +66 % Wachstum an der Spitze, chinesische Modelle vier Wochen in Folge vor US-Anbietern sowie das Anthropic-Prämien-Paradox — hoher Dollar-Umsatz bei sinkendem Token-Anteil. Sie erhalten ein Sechs-Schritte-Runbook, um öffentliche Rankings in API-Routing zu übersetzen. Preise und Regionen: NOVAKVM-Mietpreisseite, Bestellung: Bestellseite.

[ SECTION_01 ] // PAIN_MAP Benchmark-Leaderboards vs. Wochen-Token-Volumen: welches Signal ist marktrelevanter?

OpenRouter gehört zu den größten neutralen API-Aggregatoren: über 300 Modelle, mehr als 60 Anbieter, öffentliche Wochen-Rankings nach Token-Durchsatz. Anders als Hersteller-Benchmarks misst Token-Volumen, wofür Teams dauerhaft zahlen oder dauerhaft routen — ein Thermometer für Marktakzeptanz und Produktionsreife.

Benchmark-Blindspot: Statische Tests optimieren Einzelantworten; in Produktion laufen Agenten tausende Tool-Calls — Preis × Durchsatz × Stabilität ist die Rechnungswahrheit.
Launch-Narrative hinkt hinterher: Neue Modelle erscheinen auf OpenRouter oft innerhalb weniger Tage in den Wochenzahlen — schneller als Medien-Überschriften zum „stärksten Modell“.
China-USA-Umkehr: Anfang 2025 unter 2 % chinesischer Traffic-Anteil; Mai 2026 über 45 %, vier Wochen hintereinander mehr Wochen-Tokens als die USA.
Umsatz-Traffic-Divergenz: Anthropic etwa 12 % Token-Anteil (vor einem Jahr ~25 %), aber weiterhin ~46 % Dollar-Umsatzanteil auf der Plattform.
Programmierung dominiert: OpenRouter und a16z (anonymisierte Metadaten, ~100 Billionen Token) zeigen Coding-Anteile von ~11 % Anfang 2025 auf über 50 % — wichtigster Einzelfaktor beim Lesen der Top-10.
Host wird unterschätzt: Selbst optimales Routing scheitert, wenn das Gateway nach Zuklappen des Laptops abbricht — dann hilft kein günstiges Top-Modell für Langzeit-Agenten.

Cloud-APIs verarbeiten Prompts auf Anbieter-Infrastruktur, oft mit US-Transit. Für EU-Teams mit personenbezogenen Daten, Kundencode oder Gesundheitskontexten gilt vor Serienbetrieb: DSGVO-konforme Auftragsverarbeitung (AVV), Datenstandort, Subprozessor-Liste und Löschfristen mit Legal klären. Kostenlose oder Stealth-Modelle können Prompts zur Produktverbesserung speichern — dann ist On-Premise oder ein Enterprise-Vertrag oft die sauberere Wahl.

OpenRouter-Rankings und Messlogik bitte vor Integration auf der Plattform erneut prüfen.

https://openrouter.ai/rankings

[ SECTION_02 ] // DECISION_MATRIX Woche 18.–24. Mai 2026: 28,9T Gesamtvolumen und Top 10

In dieser Woche summierten sich globale API-Aufrufe auf 28,9 Billionen Token (Input + Output), +7,4 % zum Vorwoche, fünfte Steigerung in Folge. Vor einem Jahr lag das Wochenvolumen bei etwa 2,4 Billionen — rund 12-faches Wachstum in zwölf Monaten, typisch für skalierte Agent- und Batch-Inferenz.

Globale Wochenkennzahlen (2026-05-18 bis 2026-05-24)
Kennzahl	Wert	WoW
Globales Wochen-Token-Volumen	28,9 Billionen	+7,4 %
Chinesische Modelle	9,223 Billionen	+19,89 %
US-Modelle	4,93 Billionen	+16,27 %
China vs. USA	China 4. Woche in Folge #1	Anteil wächst

OpenRouter Top 10 nach Wochen-Tokens (Stand 2026-05-24)
Rang	Modell	Anbieter	Wochen-Tokens	WoW / Merkmal
1	DeepSeek-V4-Flash	DeepSeek	3,43T	+66 %; Agent-Workflows, extrem niedriger Preis
2	Tencent Hy3 Preview	Tencent	3,07T	+16 %; Wachstum nach Gratis-Phase
3	Claude Sonnet 4.6	Anthropic	1,35T	1M Kontext, Enterprise-Coding
4	DeepSeek-V3.2	DeepSeek	1,31T	Günstiges Long-Tail, Rollenspiel aktiv
5	Owl Alpha	OpenRouter	1,15T	+29 %; kostenloser Agent-Fokus
6	Gemini 3 Flash Preview	Google	1,06T	Multimodal, Akademie und Medizin
7	DeepSeek-V4-Pro	DeepSeek	1,00T	Serie gesamt ~5,74T
8	MiniMax M2.7	MiniMax	806B	Langer Kontext, Preis-Leistung
9	Grok 4.1 Fast	xAI	721B	2M Kontext, Rechtsszenarien
10	Step 3.5 Flash	StepFun	673B	Schnell und günstig, Batch

DeepSeek platzierte V4-Flash, V4-Pro und V3.2 gleichzeitig in der Spitzengruppe — Seriensumme etwa 5,74 Billionen Token (+25,9 % WoW), zwei Wochen in Folge vor Anthropic und Google auf Anbieter-Ebene. Kimi K2.6 fiel aus den Top 10; monatliche Reviews verpassen solche Routing-Fenster.

Ausgegebene Euro lügen nicht: Wochen-Tokens messen nicht „Intelligenz“, sondern „wiederholte Nutzung in breiten Engineering-Szenarien“.

[ SECTION_03 ] // DUAL_TRUTH Anbieterlandschaft: Token-Traffic, Dollar-Umsatz und Benchmarks

Marktsegmente: Traffic, Preis und typische Nutzer (Mai 2026)
Segment	Beispiel	Token-Profil	Typische Nutzer
Hoher Wert, wenig Traffic	Claude Opus-Serie	Hoher Stückpreis, wenig Wochen-Tokens vs. DeepSeek	Enterprise-Reasoning, starke Zahlungsbereitschaft
Preis-Leistung, mittlerer Traffic	Gemini 3 Flash	Multimodal ausgewogen, ~1T/Woche	Akademie, Medizin, Google-Ökosystem
Extrem günstig, hoher Traffic	DeepSeek / Hy3 / MiniMax / StepFun	0,6T–3,4T/Woche, treibt globales Wachstum	Agent, Coding, Batch-Inferenz

Der OpenRouter-a16z-Bericht „AI Usage 2025“ betont: Benchmark-Scores und Marktanteil korrelieren oft invers. Teams priorisieren Inferenzkosten, API-Latenz und Tool-Call-Stabilität über einstellige Score-Differenzen. „Standardmäßig das stärkste Modell“ ist in Agent-Pipelines häufig die falsche Default-Option.

Anthropics Spannungsfeld: Enterprise-Kunden zahlen weiter Prämie für Claude (Dollar-Anteil ~46 %), während Open Source und Ultra-Low-Cost den Großteil neuer Tokens absorbieren. DeepSeek kündigte am 22. Mai 2026 an, V4-Pro dauerhaft auf ein Viertel des Ursprungspreises zu setzen — Preisvorteil wird Struktur, nicht nur Promotion.

Für deutsche Engineering-Leads bedeutet das eine klare Metrik-Trennung: Token-Ranking zeigt, wohin die Masse fließt; Dollar-Konzentration zeigt, wo noch Enterprise-Budgets hängen. Beides zusammen entscheidet, ob Sie Hy3 für interne Experimente freigeben, Sonnet für Compliance-Pfade reservieren und V4-Flash als Default für CI-Agenten setzen — jeweils mit dokumentierter DSGVO-Bewertung pro Key.

Praktisch heißt das: ein wöchentlicher Export aus OpenRouter plus ein internes Spreadsheet mit Modell, Datenklasse und AVV-Status reicht oft aus, um Architekturentscheidungen zu beschleunigen. Teams, die nur quartalsweise Benchmarks lesen, verpassen typischerweise zwei bis drei Routing-Umschwünge pro Halbjahr — in einer Marktphase, in der Kimi K2.6 innerhalb einer Woche aus den Top 10 fällt und Owl Alpha mit +29 % nachrückt.

[ SECTION_04 ] // RUNBOOK Sechs Schritte: OpenRouter-Wochenranking in API-Routing übersetzen

Fester Wochenrhythmus: Montags openrouter.ai/rankings öffnen; globales Volumen, China-USA-Anteile und Top-10-Änderungen protokollieren; mit interner Rechnung WoW vergleichen.
Aufgaben-Tier-Routing: Agent und Batch standardmäßig DeepSeek-V4-Flash oder aktuelles Top-3-Günstigmodell; komplexe Enterprise-Reasoning-Pfade isoliert auf Claude Sonnet/Opus.
Neue Top-10-Einträge beobachten: Hy3 Preview, Owl Alpha mit WoW >20 % oft Vorboten des nächsten Defaults — 5 % Graustufen-Traffic testen.
Token vs. Euro trennen: OpenRouter-Konsole: Token-Menge und Abbuchung je Modell; hohe Euro-Konzentration bei niedrigem Token-Anteil signalisiert zu viele Premium-Keys.
Interne Erfolgsrate: Golden Issues gegen Top-Ranking- und Backup-Modelle; globales Ranking garantiert nicht Repo-Optimum.
Stabiler Agent-Host: Gateway, Node und Logs auf Remote-Mac Mini M4/M4 Pro fixieren; Modellwechsel nur per Env-Var. SSH-Baseline: Hilfezentrum.

weekly-rankings-check.sh

DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
  | mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"

Für deutsche Teams empfiehlt sich ein internes Wiki-Eintrag pro OpenRouter-Key: Datenklasse (öffentlich, intern, personenbezogen), AVV-Status und Wochenbudget. Hoher Token-Anteil bei Hy3 oder V4-Flash bedeutet nicht automatisch DSGVO-konforme Verarbeitung — Subprozessor-Kette und Transit-Land müssen pro Key bewertet werden, unabhängig vom Ranking-Platz.

[ SECTION_05 ] // CITABLE_FACTS Zitierbarer Snapshot (Woche 2026-05-18 bis 2026-05-24, offizielle Seiten maßgeblich)

Globales Wochenvolumen: 28,9 Billionen Token, +7,4 % WoW, fünfte Steigerung; vor einem Jahr ~2,4T/Woche, ~12× in zwölf Monaten.
DeepSeek-V4-Flash: 3,43 Billionen Token, +66 % WoW; MoE ~284B gesamt / 13B aktiv; OpenRouter ca. $0,14 / Mio. Input, $0,28 / Mio. Output (Seiten können angepasst werden).
DeepSeek-Serie gesamt: 5,74 Billionen Token (V4-Flash + V4-Pro + V3.2), Anbieter zwei Wochen #1.
Anthropic-Paradox: ~12 % Token vs. ~46 % Dollar-Umsatz; Claude Opus 4.6 Medienberichte ~25 Mio. USD/Monat, Wochen-Tokens weit unter DeepSeek-Einzelmodell.
Coding-Anteil: von ~11 % Anfang 2025 auf über 50 % — primärer Kontext für die Top-10-Lesart.

DeepSeek V4 Flash Modellseite und OpenRouter-Rankings vor Anbindung erneut prüfen.

https://openrouter.ai/deepseek/deepseek-v4-flash

https://openrouter.ai/rankings

[ SECTION_06 ] // CLOSE Fazit: Wochenranking als Wetterbarometer, Agent-Produktion braucht den Host

Die OpenRouter-Daten der Mai-Woche 2026 sind eindeutig: Der Markt stimmt mit Geld ab. Chinesische Open-Source-Modelle formen das globale Routing mit extrem niedrigen Kosten; entscheidend ist nicht der höchste Benchmark, sondern wiederholte Nutzung in breiten Engineering-Szenarien. Investoren, Entwickler und Medien nutzen Wochen-Token-Rankings zunehmend als Live-Scoreboard — näher an der Realität als statische „stärkste Modell“-Listen.

Wer nur wöchentlich die Tabelle aktualisiert, Agenten aber auf schlafenden Laptops, ungeplanten VPS oder instabilem SSH betreibt, verwandelt DeepSeek-V4-Flashes +66 % nicht in höhere PR-Merge-Raten. Typische Bremsen: Gateway-Abbruch beim Zuklappen, volle Platte bei OpenClaw-Upgrades, Tool-Call-Timeouts durch Netzjitter — unsichtbar im Ranking, sichtbar in der Erfolgsrate.

Für iOS/macOS-CI, OpenClaw 7×24 oder Claude Code Remote mit Gateway lohnt neben wöchentlichem API-Tuning die Migration auf exklusives Apple-Silicon-Bare-Metal oft mehr als blindes Ranking-Chasing. NOVAKVM bietet Mac Mini M4 / M4 Pro in mehreren Regionen mit flexiblen Mietzeiträumen. Pakete: Mietpreisseite, Bestellung: Bestellseite, Remote-Baseline: Hilfezentrum.

OpenRouter Wochen-Rankings:Rechnungsdaten lügen nicht — wer dominiert wirklich?