OpenRouter 最新模型週調用量排行:
帳單數據不會說謊,誰才是真正的王者?

企業 IT 與開發團隊若在 2026 年中仍只看 MMLU、HumanEval 榜單選大模型,卻忽略每週實際燒掉多少 Token,很容易在 Agent 批次作業、程式碼流水線裡選到「考試滿分、帳單爆炸」的模型。本文以 OpenRouter 按週(7 天滾動)統計的 Token 調用量為錨,解讀截至 2026 年 5 月 24 日最新一週的全球格局:28.9 兆 TokenDeepSeek-V4-Flash 週增 66% 登頂、中國模型連續四週壓過美國,以及 Anthropic「高 Token 單價、低流量份額」的溢價悖論。讀完你將獲得可執行的六步週榜追蹤清單,把公開排行變成 API 路由策略。價格與節點以 NOVAKVM 租用價格頁為準;雲端 Mac 下單見 雲端訂購頁

OpenRouter 是全球最大的中立 AI 模型 API 聚合平台之一:接入 300+ 模型、覆蓋 60+ 供應商,公開披露按週滾動的 Token 吞吐量排行。與廠商自報的評測分數不同,Token 調用量衡量的是「開發者願意為之持續付費或持續呼叫的規模」——這是 AI 落地與市場認可度的體溫計。

  • 基準測試的盲區:靜態榜單優化的是單次答題;正式環境裡 Agent 要跑成千上萬次工具呼叫,單價 × 吞吐 × 穩定性才是帳單真相。
  • 發表會敘事滯後:新模型上架 OpenRouter 後,週榜通常在數日內反映真實分流,比媒體「最強模型」標題更即時。
  • 中美格局劇變:2025 年初中國模型在 OpenRouter 流量占比不足 2%;至 2026 年 5 月已超 45%,連續四週週調用量高於美國。
  • 收入與流量背離:Anthropic 的 Token 份額約 12%(較一年前 25% 下滑),美元收入份額仍約 46%——說明高價企業客戶仍在,但流量主導權已轉移。
  • 程式設計任務主導:OpenRouter 與 a16z 聯合報告(基於約 100 兆 Token匿名中繼資料)指出,程式設計相關用途從 2025 年初約 11% 升至超 50%,成為最大單一場景。
  • 宿主環境被低估:模型路由再精明,若 Gateway 跑在會休眠的筆電、頻寬不穩的共用伺服器上,週榜上的「高 CP 值模型」也無法完成長時 Agent。

OpenRouter 官方排行榜與統計口徑請以平台最新頁面為準;接入前請再次開啟下列連結核對。

https://openrouter.ai/rankings

該週全球 AI 模型 API 呼叫合計 28.9 兆 Token(輸入 + 輸出),環比 +7.4%,連續第五週上漲。一年前 OpenRouter 週處理量約 2.4 兆,一年間成長約 12 倍,反映 Agent 與批次推論已進入規模化階段。

全球週調用量宏觀指標(2026-05-18 至 2026-05-24)
指標 數值 環比
全球週 Token 總量 28.9 兆 +7.4%
中國模型週調用量 9.223 兆 +19.89%
美國模型週調用量 4.93 兆 +16.27%
中美週榜對比 中國連續四週第一 份額持續擴大
OpenRouter 模型週調用量 Top 10(Token 量,截至 2026-05-24)
排名 模型 廠商 週 Token 量 環比 / 特點
1 DeepSeek-V4-Flash DeepSeek 3.43T +66%;Agent 工作流首選,極低單價
2 腾讯 Hy3 Preview Tencent 3.07T +16%;限免結束後仍高成長
3 Claude Sonnet 4.6 Anthropic 1.35T 百萬上下文,企業程式設計主力
4 DeepSeek-V3.2 DeepSeek 1.31T 低價長尾,角色扮演活躍
5 Owl Alpha OpenRouter 1.15T +29%;免費 Agent 特化
6 Gemini 3 Flash Preview Google 1.06T 多模態,學術與醫療場景
7 DeepSeek-V4-Pro DeepSeek 1.00T 系列合計約 5.74T
8 MiniMax M2.7 MiniMax 806B 長上下文 CP 值
9 Grok 4.1 Fast xAI 721B 2M 上下文,法律場景
10 Step 3.5 Flash StepFun 673B 快速低價,批次處理

DeepSeek 旗下 V4-Flash、V4-Pro、V3.2 三款同時進入前列,系列週調用合計約 5.74 兆 Token(環比約 +25.9%),連續兩週在廠商維度超越 Anthropic 與 Google。前週排名第 6 的 Kimi K2.6 當週跌出前十,說明週榜輪動極快,按月複盤會錯過路由視窗。

花出去的錢不說謊:週 Token 量不是「誰最聰明」,而是「誰在最廣泛的工程場景裡被反覆呼叫」。

市場分層:流量、定價與典型場景(2026 年 5 月週榜語境)
分層 代表模型 Token 特徵 典型使用者
高價值·低流量 Claude Opus 系列 單價高,週 Token 遠低於 DeepSeek 企業複雜推論,付費能力強
CP 值·中流量 Gemini 3 Flash 多模態均衡,週量約 1T 級 學術、醫療、Google 生態
極低價·高流量 DeepSeek / Hy3 / MiniMax / StepFun 週量 0.6T–3.4T,驅動全球增量 Agent、程式設計、批次處理

OpenRouter 與 a16z《2025 AI 使用報告》的核心發現之一:模型基準測試分數與市場份額往往呈反向關係。開發者更關注推論成本、API 延遲與工具呼叫穩定性,而非榜單上個位數的分數差。對工程團隊而言,這意味著「預設最強模型」在 Agent 流水線裡常常是錯誤預設項

Anthropic 的困局在於:企業客戶仍為 Claude 支付溢價(美元收入份額約 46%),但開源與超低價模型已吞下大部分新增 Token。DeepSeek 於 2026 年 5 月 22 日宣布 V4-Pro API 永久調價至原價四分之一(促銷期結束後生效),把價格優勢從短期活動變成長期常態,進一步擠壓高價模型的流量空間。

  1. 固定複盤節奏:每週一開啟 openrouter.ai/rankings,記錄全球總量、中美占比與 Top 10 變動;與內部帳單週環比對照,發現「用量漲但榜外模型」的異常路由。
  2. 按任務分檔路由:Agent / 批次處理預設 DeepSeek-V4-Flash 或當週 Top 3 低價模型;企業級複雜推論保留 Claude Sonnet / Opus 獨立 Key,避免全量走高價檔。
  3. 監控新進榜單模型:Hy3 Preview、Owl Alpha 等當週環比增速 >20% 的條目,往往是下一波預設項的訊號,可開 5% 灰度流量試跑。
  4. 分離 Token 指標與收入指標:在 OpenRouter 控制台分別看各模型 Token 量與扣費金額;若收入集中度遠高於 Token 集中度,說明路由裡高價模型占比過高。
  5. 對照內部成功率:對同一黃金 Issue 集比較 Top 榜模型與備選模型的工具呼叫失敗率;週榜只反映全球聚合,不保證你的儲存庫最優。
  6. 綁定穩定 Agent 宿主:在遠端 Mac Mini M4/M4 Pro 雲端節點上固定 Gateway、Node 與日誌策略;換模型只改環境變數,不因本機休眠中斷長時任務。SSH 與常駐基線見 雲端幫助中心
weekly-rankings-check.sh
DATE=$(date +%Y-%m-%d)
curl -s https://openrouter.ai/rankings -o "/var/log/or-rankings-$DATE.html"
diff "/var/log/or-rankings-last.html" "/var/log/or-rankings-$DATE.html" \
  | mail -s "OpenRouter weekly delta" ops@example.com
cp "/var/log/or-rankings-$DATE.html" "/var/log/or-rankings-last.html"

  • 全球週 Token 總量:28.9 兆,環比 +7.4%,連續五週上漲;一年前約 2.4 兆/週,年化量級約 12 倍
  • DeepSeek-V4-Flash 週冠軍:3.43 兆 Token,環比 +66%;MoE 架構約 284B 總參 / 13B 激活,OpenRouter 公開價約 $0.14 / 百萬輸入$0.28 / 百萬輸出(頁面可能調整)。
  • DeepSeek 系列週合計:5.74 兆 Token(V4-Flash + V4-Pro + V3.2),廠商維度連續兩週第一。
  • Anthropic 份額悖論:Token 份額約 12% vs 美元收入份額約 46%;Claude Opus 4.6 月收入量級約 2,500 萬美元級(媒體報導),但週 Token 遠低於 DeepSeek 單模型。
  • 程式設計用途占比:OpenRouter + a16z 報告顯示程式設計任務從 2025 年初 11% 升至超 50%,是解讀週榜「誰霸榜」的首要背景。

DeepSeek V4 Flash 模型頁與 OpenRouter 週榜請在接入前再次核對。

https://openrouter.ai/deepseek/deepseek-v4-flash

https://openrouter.ai/rankings

2026 年 5 月這週的 OpenRouter 資料給出的訊號足夠清晰:市場正在用錢投票,中國開源模型以極低成本重塑全球呼叫格局;不是誰基準測試最高,而是誰在最廣的工程場景裡被反覆呼叫,才推動 AI 真正落地。投資人、開發者與媒體愈來愈把週 Token 排行當作「AI 競賽」的即時記分板——這比任何靜態「最強模型」清單都更接近真相。

但若只每週刷新榜單、卻把 Agent 跑在會休眠的筆電、無日誌規劃的共用伺服器或跨國高延遲 SSH 鏈路上,DeepSeek-V4-Flash 的 66% 週增速也無法轉化成你儲存庫裡的 PR 合併率。常見短板包括:合蓋斷 Gateway、磁碟打滿導致 OpenClaw 升級失敗、以及工具呼叫因頻寬抖動逾時——它們不會出現在 OpenRouter 週榜上,卻直接拉低帳單裡最優模型的實際成功率。

若你的目標是 iOS/macOS CI、OpenClaw 7×24、或 Claude Code 遠端直連 Gateway 等正式環境 Agent 流水線,在按週調整 API 路由的同時,把宿主遷到獨占 Apple Silicon 裸金屬雲端節點通常比盲目追榜更划算:NOVAKVM 提供多區域 Mac Mini M4 / M4 Pro 彈性租期,適合與週榜複盤同頻擴容。方案見 租用價格頁,下單見 雲端訂購頁;頻寬與 SSH 基線見 雲端幫助中心