Если в середине 2026 вы всё ещё выбираете LLM по MMLU, а не по фактическому недельному объёму токенов, в Agent-пайплайнах и coding-ботах легко получить «экзаменационного чемпиона» с раздутым счётом. Здесь разбор 7-дневного rolling-рейтинга OpenRouter за 18–24 мая 2026: 28,9T токенов глобально, DeepSeek-V4-Flash #1 с +66 % WoW, китайские модели четвёртую неделю обгоняют США, плюс парадокс Anthropic — ~12 % токенов при ~46 % долларовой выручки. В конце — runbook из шести шагов и привязка к хосту. Тарифы: страница цен NOVAKVM, заказ: оформить заказ.
[ SECTION_01 ] // PAIN_MAP Почему недельные токены ближе к рынку, чем статические бенчмарки
OpenRouter — нейтральный агрегатор 300+ моделей и 60+ вендоров. Публичный рейтинг сортирует по реально списанным токенам за скользящую неделю. Это не «кто умнее на тесте», а «за что разработчики платят повторно» — термометр продакшен-адопшена.
- Бенчмарки слепы к биллингу: в проде Agent гоняет тысячи tool calls; важны цена × throughput × стабильность API, а не +0,3 пункта MMLU.
- Лаг презентаций: новая модель на OpenRouter попадает в weekly chart за дни, быстрее пресс-релизов «самая сильная модель».
- Разворот Китай–США: с <2 % китайского трафика в начале 2025 до >45 % в мае 2026; четыре недели подряд Китай #1 по недельным токенам.
- Разрыв трафика и выручки: Anthropic ~12 % токенов (год назад ~25 %), но ~46 % долларов на платформе — премиум-клиенты остались, масса ушла в дешёвые модели.
- Кодинг — главный use case: отчёт OpenRouter + a16z (~100T токенов метаданных): coding с ~11 % (нач. 2025) до >50 % — ключ к чтению Top 10.
- Хост недооценён: Gateway на ноутбуке, который засыпает при закрытии крышки, убивает ROI даже у #1 модели рейтинга.
Официальный рейтинг — перепроверьте перед интеграцией.
https://openrouter.ai/rankings
[ SECTION_02 ] // DECISION_MATRIX 18–24 мая 2026: 28,9T и Top 10
Глобальный объём: 28,9T токенов (input+output), +7,4 % WoW, пятый рост подряд. Год назад ~2,4T/нед — примерно 12× за год, типично для масштабирования Agent/batch inference.
| Метрика | Значение | WoW |
|---|---|---|
| Глобально / неделя | 28,9T | +7,4 % |
| Китайские модели | 9,223T | +19,89 % |
| US-модели | 4,93T | +16,27 % |
| Китай vs США | Китай #1, 4-я неделя | Доля растёт |
| # | Модель | Вендор | Токены | WoW / нота |
|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3,43T | +66 %; Agent default, копейки за M |
| 2 | Tencent Hy3 Preview | Tencent | 3,07T | +16 %; рост после free-tier |
| 3 | Claude Sonnet 4.6 | Anthropic | 1,35T | 1M ctx, enterprise coding |
| 4 | DeepSeek-V3.2 | DeepSeek | 1,31T | Дешёвый long-tail |
| 5 | Owl Alpha | OpenRouter | 1,15T | +29 %; free Agent-specialized |
| 6 | Gemini 3 Flash Preview | 1,06T | Multimodal | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1,00T | Серия ~5,74T |
| 8 | MiniMax M2.7 | MiniMax | 806B | Long ctx / $ |
| 9 | Grok 4.1 Fast | xAI | 721B | 2M ctx |
| 10 | Step 3.5 Flash | StepFun | 673B | Batch / speed |
Серия DeepSeek (V4-Flash + V4-Pro + V3.2) — ~5,74T (+25,9 % WoW), вторую неделю #1 среди вендоров, обходя Anthropic и Google. Kimi K2.6 выпал из Top 10: monthly review = пропущенное routing-окно.
Деньги не врут: weekly tokens — это не IQ-score, а частота вызова в реальных engineering-сценариях.
[ SECTION_03 ] // DUAL_TRUTH Тройная правда: трафик, доллары, бенчмарки
| Сегмент | Пример | Профиль | Кто платит |
|---|---|---|---|
| High $ / low traffic | Claude Opus | Дорогой токен, мало weekly volume | Enterprise reasoning |
| Mid traffic / balanced | Gemini 3 Flash | ~1T/нед, multimodal | Academia, health, Google stack |
| Ultra-cheap / high traffic | DeepSeek, Hy3, MiniMax, StepFun | 0,6T–3,4T/нед | Agent, coding, batch |
Отчёт OpenRouter–a16z: бенчмарк и market share часто обратно коррелируют. Инженеры оптимизируют $/качество, p99 latency и fail-rate tool calls. Default «самая умная модель» в agent loop — типичный антипаттерн.
22 мая 2026 DeepSeek зафиксировал V4-Pro по ¼ исходной цены навсегда — ценовое преимущество стало инфраструктурой, не акцией. Anthropic держит ~46 % $ при 12 % токенов: enterprise ещё платит премию, но поток новых токенов утекает в open-weight и ultra-low-cost.
[ SECTION_04 ] // RUNBOOK Шесть шагов: weekly chart → API routing
- Cadence: каждый понедельник —
openrouter.ai/rankings; логируйте global total, China/US share, delta Top 10; сверяйте с внутренним биллингом WoW. - Tier routing: Agent/batch default — DeepSeek-V4-Flash или текущий Top-3 cheap; сложный enterprise reasoning — отдельный ключ Sonnet/Opus.
- Watch newcomers: Hy3 Preview, Owl Alpha с WoW >20 % — кандидаты в следующий default; 5 % canary traffic.
- Split metrics: в консоли OpenRouter отдельно tokens vs $; если $ концентрированы сильнее tokens — перекос на premium.
- Golden issues: один и тот же набор issue против top-ranked и backup; глобальный chart ≠ оптимум вашего repo.
- Stable host: Gateway/Node/logs на remote Mac Mini M4/M4 Pro; смена модели — только env vars. SSH baseline: центр помощи.
DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
| mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"
[ SECTION_05 ] // CITABLE_FACTS Снимок для цитирования (2026-05-18 — 2026-05-24)
- Global weekly: 28,9T, +7,4 % WoW, 5-й рост; год назад ~2,4T/нед, ~12× YoY.
- DeepSeek-V4-Flash: 3,43T, +66 %; MoE ~284B total / 13B active; OR ~$0.14/M in, $0.28/M out.
- DeepSeek series: 5,74T (V4-Flash + V4-Pro + V3.2), vendor #1 две недели.
- Anthropic paradox: ~12 % tokens vs ~46 % $; Opus 4.6 в прессе ~$25M/mo, weekly tokens << одного DeepSeek.
- Coding share: 11 % → >50 % — главный lens для Top 10.
Страница DeepSeek V4 Flash и rankings — перепроверьте перед продом.
https://openrouter.ai/deepseek/deepseek-v4-flash
https://openrouter.ai/rankings
[ SECTION_06 ] // CLOSE Вывод: weekly chart — live scoreboard, Agent всё равно нужен хост
Сигнал мая 2026 однозначен: рынок голосует деньгами. Китайский open source на копейках за миллион токенов перекраивает глобальный routing; побеждает не лидер MMLU, а модель, которую тысячи пайплайнов дергают снова и снова. Weekly token rankings — ближе к реальности, чем статические «strongest model» списки.
Обновлять chart без стабильного хоста бессмысленно: MacBook с sleep, VPS без log rotation, SSH с jitter — +66 % V4-Flash не превратится в merge rate. Gateway падает при закрытии крышки, диск забивается на OpenClaw upgrade, tool calls таймаутятся — этого нет в OpenRouter chart, но это видно в вашем CI.
Для iOS/macOS CI, OpenClaw 7×24, Claude Code Remote + Gateway имеет смысл параллельно weekly API-tuning мигрировать на dedicated Apple Silicon bare metal. NOVAKVM — Mac Mini M4 / M4 Pro, несколько регионов, гибкие сроки аренды. Тарифы: страница цен, заказ: оформить заказ, remote baseline: центр помощи.