OpenRouter: недельный рейтинг токенов —
биллинг против бенчмарков, май 2026

Если в середине 2026 вы всё ещё выбираете LLM по MMLU, а не по фактическому недельному объёму токенов, в Agent-пайплайнах и coding-ботах легко получить «экзаменационного чемпиона» с раздутым счётом. Здесь разбор 7-дневного rolling-рейтинга OpenRouter за 18–24 мая 2026: 28,9T токенов глобально, DeepSeek-V4-Flash #1 с +66 % WoW, китайские модели четвёртую неделю обгоняют США, плюс парадокс Anthropic — ~12 % токенов при ~46 % долларовой выручки. В конце — runbook из шести шагов и привязка к хосту. Тарифы: страница цен NOVAKVM, заказ: оформить заказ.

OpenRouter — нейтральный агрегатор 300+ моделей и 60+ вендоров. Публичный рейтинг сортирует по реально списанным токенам за скользящую неделю. Это не «кто умнее на тесте», а «за что разработчики платят повторно» — термометр продакшен-адопшена.

  • Бенчмарки слепы к биллингу: в проде Agent гоняет тысячи tool calls; важны цена × throughput × стабильность API, а не +0,3 пункта MMLU.
  • Лаг презентаций: новая модель на OpenRouter попадает в weekly chart за дни, быстрее пресс-релизов «самая сильная модель».
  • Разворот Китай–США: с <2 % китайского трафика в начале 2025 до >45 % в мае 2026; четыре недели подряд Китай #1 по недельным токенам.
  • Разрыв трафика и выручки: Anthropic ~12 % токенов (год назад ~25 %), но ~46 % долларов на платформе — премиум-клиенты остались, масса ушла в дешёвые модели.
  • Кодинг — главный use case: отчёт OpenRouter + a16z (~100T токенов метаданных): coding с ~11 % (нач. 2025) до >50 % — ключ к чтению Top 10.
  • Хост недооценён: Gateway на ноутбуке, который засыпает при закрытии крышки, убивает ROI даже у #1 модели рейтинга.

Официальный рейтинг — перепроверьте перед интеграцией.

https://openrouter.ai/rankings

Глобальный объём: 28,9T токенов (input+output), +7,4 % WoW, пятый рост подряд. Год назад ~2,4T/нед — примерно 12× за год, типично для масштабирования Agent/batch inference.

Макро-метрики недели (2026-05-18 — 2026-05-24)
Метрика Значение WoW
Глобально / неделя 28,9T +7,4 %
Китайские модели 9,223T +19,89 %
US-модели 4,93T +16,27 %
Китай vs США Китай #1, 4-я неделя Доля растёт
OpenRouter Top 10 по недельным токенам (2026-05-24)
# Модель Вендор Токены WoW / нота
1 DeepSeek-V4-Flash DeepSeek 3,43T +66 %; Agent default, копейки за M
2 Tencent Hy3 Preview Tencent 3,07T +16 %; рост после free-tier
3 Claude Sonnet 4.6 Anthropic 1,35T 1M ctx, enterprise coding
4 DeepSeek-V3.2 DeepSeek 1,31T Дешёвый long-tail
5 Owl Alpha OpenRouter 1,15T +29 %; free Agent-specialized
6 Gemini 3 Flash Preview Google 1,06T Multimodal
7 DeepSeek-V4-Pro DeepSeek 1,00T Серия ~5,74T
8 MiniMax M2.7 MiniMax 806B Long ctx / $
9 Grok 4.1 Fast xAI 721B 2M ctx
10 Step 3.5 Flash StepFun 673B Batch / speed

Серия DeepSeek (V4-Flash + V4-Pro + V3.2) — ~5,74T (+25,9 % WoW), вторую неделю #1 среди вендоров, обходя Anthropic и Google. Kimi K2.6 выпал из Top 10: monthly review = пропущенное routing-окно.

Деньги не врут: weekly tokens — это не IQ-score, а частота вызова в реальных engineering-сценариях.

Сегменты рынка (май 2026)
Сегмент Пример Профиль Кто платит
High $ / low traffic Claude Opus Дорогой токен, мало weekly volume Enterprise reasoning
Mid traffic / balanced Gemini 3 Flash ~1T/нед, multimodal Academia, health, Google stack
Ultra-cheap / high traffic DeepSeek, Hy3, MiniMax, StepFun 0,6T–3,4T/нед Agent, coding, batch

Отчёт OpenRouter–a16z: бенчмарк и market share часто обратно коррелируют. Инженеры оптимизируют $/качество, p99 latency и fail-rate tool calls. Default «самая умная модель» в agent loop — типичный антипаттерн.

22 мая 2026 DeepSeek зафиксировал V4-Pro по ¼ исходной цены навсегда — ценовое преимущество стало инфраструктурой, не акцией. Anthropic держит ~46 % $ при 12 % токенов: enterprise ещё платит премию, но поток новых токенов утекает в open-weight и ultra-low-cost.

  1. Cadence: каждый понедельник — openrouter.ai/rankings; логируйте global total, China/US share, delta Top 10; сверяйте с внутренним биллингом WoW.
  2. Tier routing: Agent/batch default — DeepSeek-V4-Flash или текущий Top-3 cheap; сложный enterprise reasoning — отдельный ключ Sonnet/Opus.
  3. Watch newcomers: Hy3 Preview, Owl Alpha с WoW >20 % — кандидаты в следующий default; 5 % canary traffic.
  4. Split metrics: в консоли OpenRouter отдельно tokens vs $; если $ концентрированы сильнее tokens — перекос на premium.
  5. Golden issues: один и тот же набор issue против top-ranked и backup; глобальный chart ≠ оптимум вашего repo.
  6. Stable host: Gateway/Node/logs на remote Mac Mini M4/M4 Pro; смена модели — только env vars. SSH baseline: центр помощи.
weekly-rankings-check.sh
DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
  | mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"

  • Global weekly: 28,9T, +7,4 % WoW, 5-й рост; год назад ~2,4T/нед, ~12× YoY.
  • DeepSeek-V4-Flash: 3,43T, +66 %; MoE ~284B total / 13B active; OR ~$0.14/M in, $0.28/M out.
  • DeepSeek series: 5,74T (V4-Flash + V4-Pro + V3.2), vendor #1 две недели.
  • Anthropic paradox: ~12 % tokens vs ~46 % $; Opus 4.6 в прессе ~$25M/mo, weekly tokens << одного DeepSeek.
  • Coding share: 11 %>50 % — главный lens для Top 10.

Страница DeepSeek V4 Flash и rankings — перепроверьте перед продом.

https://openrouter.ai/deepseek/deepseek-v4-flash

https://openrouter.ai/rankings

Сигнал мая 2026 однозначен: рынок голосует деньгами. Китайский open source на копейках за миллион токенов перекраивает глобальный routing; побеждает не лидер MMLU, а модель, которую тысячи пайплайнов дергают снова и снова. Weekly token rankings — ближе к реальности, чем статические «strongest model» списки.

Обновлять chart без стабильного хоста бессмысленно: MacBook с sleep, VPS без log rotation, SSH с jitter — +66 % V4-Flash не превратится в merge rate. Gateway падает при закрытии крышки, диск забивается на OpenClaw upgrade, tool calls таймаутятся — этого нет в OpenRouter chart, но это видно в вашем CI.

Для iOS/macOS CI, OpenClaw 7×24, Claude Code Remote + Gateway имеет смысл параллельно weekly API-tuning мигрировать на dedicated Apple Silicon bare metal. NOVAKVMMac Mini M4 / M4 Pro, несколько регионов, гибкие сроки аренды. Тарифы: страница цен, заказ: оформить заказ, remote baseline: центр помощи.