2026 年の Agent 開発現場では、MMLU や HumanEval の順位だけでモデルを決めると、本番のバッチ処理やコーディングパイプラインで「スコアは高いが請求が跳ねる」事態が起きやすくなっています。本稿は OpenRouter が週単位(7 日ローリング)で公開するトークン呼び出し量を軸に、2026 年 5 月 24 日時点の最新週を読み解きます。世界合計 28.9 兆トークン、DeepSeek-V4-Flash が週次 +66% で首位、中国モデルが米国を 4 週連続で上回る構図、そして Anthropic の「高単価・低トラフィックシェア」というプレミアムのパラドックスを整理します。読了後には、公開ランキングを API ルーティング方針へ落とし込む六ステップの週次チェックリストが手に入ります。料金とノードは NOVAKVM 料金ページを正とし、リモート Mac の注文は 注文ページをご利用ください。
[ SECTION_01 ] // PAIN_MAP ベンチマーク順位と週次トークン量:どちらが市場の体温計か
OpenRouter は中立的な AI モデル API 集約基盤として、300 超のモデルと 60 超のプロバイダを束ね、週次のトークンスループットランキングを公開しています。各社が自社発表するベンチマーク点とは異なり、トークン呼び出し量は「開発者が継続的に課金し、継続的に叩いている規模」を測ります。エンジニアリング組織にとって、これは市場採用の実測値に近い指標です。
- 静的ベンチの限界:単発回答の最適化と、本番 Agent の数万回ツール呼び出しでは勝ち筋が異なります。単価 × スループット × 安定性が請求の本体です。
- 発表会ナラティブの遅れ:新モデルが OpenRouter に載ったあと、週榜は数日で実トラフィックの分流を反映します。メディアの「最強モデル」見出しより速いことが多いです。
- 中米シェアの転換点:2025 年初頭、中国モデルの OpenRouter 流量シェアは 2% 未満でした。2026 年 5 月には 45% 超に達し、4 週連続で米国を上回っています。
- 収入と流量の分離:Anthropic のトークンシェアは約 12%(1 年前 25% から低下)なのに対し、ドル収入シェアは依然 46% 前後です。高単価の企業顧客は残りつつ、流量の主導権は移っています。
- コーディング用途の拡大:OpenRouter と a16z の共同レポート(約 100 兆トークンの匿名メタデータ)では、コーディング関連用途が 2025 年初の 11% から 50% 超へ伸び、最大の単一シーンになっています。
- ホスト環境の見落とし:ルーティングをいくら最適化しても、ノート PC がスリープすると Gateway が切れ、週榜で選んだ低単価モデルでも長時間 Agent は完走しません。
OpenRouter 公式ランキングと集計定義は、接続前に必ず最新ページで再確認してください。
https://openrouter.ai/rankings
[ SECTION_02 ] // DECISION_MATRIX 2026 年 5 月 18–24 日週:28.9T 合計と Top 10 モデル
当該週の世界 AI モデル API 呼び出しは入出力合わせて 28.9 兆トークン、前週比 +7.4%、5 週連続の増加です。1 年前の OpenRouter 週処理量は約 2.4 兆で、1 年でおよそ 12 倍に伸びています。Agent とバッチ推論が量産段階に入ったことを示す数字です。
| 指標 | 数値 | 前週比 |
|---|---|---|
| 世界週トークン合計 | 28.9 兆 | +7.4% |
| 中国モデル週呼び出し | 9.223 兆 | +19.89% |
| 米国モデル週呼び出し | 4.93 兆 | +16.27% |
| 中米週榜比較 | 中国が 4 週連続首位 | シェア拡大継続 |
| 順位 | モデル | ベンダー | 週トークン量 | 前週比 / 特徴 |
|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66%;Agent ワークフロー向け、極低単価 |
| 2 | 腾讯 Hy3 Preview | Tencent | 3.07T | +16%;無料期終了後も高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | 百万コンテキスト、企業コーディング主力 |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | 低単価ロングテール、ロールプレイ活発 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29%;無料 Agent 特化 |
| 6 | Gemini 3 Flash Preview | 1.06T | マルチモーダル、学術・医療シーン | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | シリーズ合計約 5.74T |
| 8 | MiniMax M2.7 | MiniMax | 806B | 長コンテキストのコスパ |
| 9 | Grok 4.1 Fast | xAI | 721B | 2M コンテキスト、法務シーン |
| 10 | Step 3.5 Flash | StepFun | 673B | 高速低単価、バッチ処理向け |
DeepSeek の V4-Flash、V4-Pro、V3.2 が同時に上位に入り、シリーズ週合計は約 5.74 兆トークン(前週比約 +25.9%)です。ベンダー次元では 2 週連続で Anthropic と Google を上回りました。前週 6 位だった Kimi K2.6 は当週 Top 10 から脱落しており、月次だけの振り返りではルーティング窓を逃しやすいことがわかります。
支払った金額は嘘をつきません。週トークン量は「誰が最も賢いか」ではなく、「どのモデルが最も広い工程現場で繰り返し叩かれているか」を示します。
[ SECTION_03 ] // DUAL_TRUTH ベンダー格局:トラフィック、ドル収入、ベンチの三重構造
| レイヤー | 代表モデル | トークン特性 | 典型ユーザー |
|---|---|---|---|
| 高単価・低流量 | Claude Opus 系列 | 単価高、週トークンは DeepSeek より大幅に少ない | 企業の複雑推論、支払能力が高い層 |
| バランス・中流量 | Gemini 3 Flash | マルチモーダル均衡、週量は約 1T 級 | 学術、医療、Google エコシステム |
| 極低単価・高流量 | DeepSeek / Hy3 / MiniMax / StepFun | 週量 0.6T–3.4T、世界増分を牽引 | Agent、コーディング、バッチ推論 |
OpenRouter と a16z の「2025 AI 利用レポート」が示す通り、ベンチマーク点と市場シェアはしばしば逆相関します。開発者はスコアの小数点差より、推論コスト、API レイテンシ、ツール呼び出しの安定性を優先します。Agent パイプラインでは「デフォルト最強モデル」が誤ったデフォルトになることが珍しくありません。
Anthropic の立ち位置は難しいです。企業顧客は Claude にプレミアムを払い続け(ドル収入シェア約 46%)、オープンかつ超低単価モデルが新規トークンの大半を吸収しています。DeepSeek は 2026 年 5 月 22 日に V4-Pro API を恒久的に定価の 4 分の 1へ(プロモ終了後適用)と発表し、価格優位を一時施策から常態へ移しました。高単価モデルの流量空間はさらに圧迫される見込みです。
[ SECTION_04 ] // RUNBOOK 六ステップ:OpenRouter 週榜を実行可能な API ルーティングへ
- 振り返りリズムを固定する:毎週月曜に
openrouter.ai/rankingsを開き、世界合計・中米シェア・Top 10 の変動を記録します。社内請求の週次比較と突き合わせ、「用量は増えたが榜外モデル」という異常ルートを早期に検知します。 - タスク別にルートを分ける:Agent / バッチは DeepSeek-V4-Flash または当週 Top 3 の低単価モデルをデフォルトにします。企業向け複雑推論だけ Claude Sonnet / Opus 用の独立 Key を残し、全量を高単価帯に流さないようにします。
- 新規上榜モデルを監視する:Hy3 Preview、Owl Alpha など前週比 +20% 超の項目は、次のデフォルト候補のシグナルです。5% のグレートラフィックで試走する価値があります。
- トークン指標と収入指標を分離する:OpenRouter コンソールでモデル別のトークン量と課金額を別々に見ます。収入集中度がトークン集中度を大きく上回るなら、高単価モデルの比率が過剰です。
- 社内成功率と照合する:同一のゴールデン Issue セットで、榜上位モデルと代替モデルのツール呼び出し失敗率を比較します。週榜は世界集計であり、自社リポジトリの最適解を保証しません。
- 安定した Agent ホストに紐づける:リモート Mac Mini M4/M4 Pro で Gateway、Node、ログ方針を固定します。モデル変更は環境変数のみとし、本機スリープによる長時間タスク中断を避けます。SSH と常駐基線は ヘルプセンターをご参照ください。
DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
| mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"
[ SECTION_05 ] // CITABLE_FACTS 引用可能な技術スナップショット(2026-05-18 〜 2026-05-24、公式を正とする)
- 世界週トークン合計:28.9 兆、前週比 +7.4%、5 週連続増。1 年前は約 2.4 兆/週で、年間で約 12 倍。
- DeepSeek-V4-Flash 週チャンピオン:3.43 兆トークン、前週比 +66%。MoE 約 284B 総パラ / 13B アクティブ。OpenRouter 公開価格は入力約 $0.14/百万、出力約 $0.28/百万(ページ改定の可能性あり)。
- DeepSeek 系列週合計:5.74 兆トークン(V4-Flash + V4-Pro + V3.2)、ベンダー次元 2 週連続首位。
- Anthropic シェアのパラドックス:トークンシェア約 12% 対 ドル収入シェア約 46%。Claude Opus 4.6 の月収は報道ベースで 2,500 万ドル級とされる一方、週トークンは DeepSeek 単体を大きく下回ります。
- コーディング用途比率:OpenRouter + a16z レポートで、2025 年初 11% から 50% 超へ。週榜の「誰が上位か」を読む第一の背景です。
DeepSeek V4 Flash のモデルページと OpenRouter 週榜は、接続前に再度ご確認ください。
https://openrouter.ai/deepseek/deepseek-v4-flash
https://openrouter.ai/rankings
[ SECTION_06 ] // CLOSE 結論:週榜は市場の晴雨計、Agent 本番にはホストの固定が要る
2026 年 5 月第 3 週の OpenRouter データが示すシグナルは明確です。市場は課金で投票しており、中国発の低コストモデルが世界の呼び出し格局を塗り替えています。ベンチマーク最高ではなく、最も広い工程現場で繰り返し選ばれるモデルが、AI 実装の速度を決めています。投資家、開発者、メディアの間でも、週次トークン順位は「AI 競争」のリアルタイムスコアボードとして参照され始めています。
一方で、週榜だけを刷新し、Agent をスリープするノート PC、ログ設計のない VPS、高レイテンシの越境 SSH 上で動かしても、DeepSeek-V4-Flash の +66% は自社の PR マージ率には直結しません。蓋を閉じたら Gateway が落ちる、ディスク満杯で OpenClaw のアップグレードが失敗する、ネットワークジッターでツール呼び出しがタイムアウトする——これらは週榜には出ませんが、最適モデルの実成功率を直接下げます。
iOS/macOS CI、OpenClaw 7×24、Claude Code リモート Gateway 直結といった本番級 Agent パイプラインを目指すなら、週次で API ルートを調整しつつ、ホストを専有 Apple Silicon ベアメタルへ移す方が、榜追いだけより費用対効果が高い場合が多いです。NOVAKVM は複数リージョンの Mac Mini M4 / M4 Pro を日次〜四半期で提供し、週次レビューと同じリズムでスケールできます。プランは 料金ページ、注文は 注文ページからお進みください。