OpenClaw 模型使用量排名解读:谁在驱动 2026 年最火的 AI Agent?

🦞 OpenRouter × OpenClaw
OpenClaw 模型使用量排名解读
谁在驱动 2026 年最火的 AI Agent?
基于 OpenRouter 公开的真实 token 消耗数据(2026 年 4 月更新),深度解析 OpenClaw 用户最青睐的 20 个模型及其排名背后的逻辑。
OpenRouter × OpenClaw 总 token 消耗: 18.1T
什么是 OpenClaw?
OpenClaw(前身 Clawdbot)是 2026 年最火的开源 AI Agent 平台,在 OpenRouter 应用排行榜上以 18.1T token 的累计消耗量排名全球第一,远超第二名 Kilo Code(5.75T)和第三名 Claude Code(2.25T)。它能在本地运行,连接 WhatsApp、Discord、Slack 等即时通讯工具,通过浏览器自动化、Shell 命令执行和持久记忆,24/7 执行日常工作。
OpenClaw 通过 OpenRouter 接入了 347 个模型。下面的排名基于过去 30 天的真实 token 使用量,反映了全球用户的实际偏好。
Top 20 模型使用量排名
1 Step 3.5 Flash FREE 中国
StepFun 阶跃星辰196B MoE / 11B 激活
3.4T tokens
为什么排第一:完全免费 + 推理能力出色。OpenClaw 是一个 24/7 运行的 Agent,每天产生大量 token。对于绝大多数用户来说,成本是首要考量。Step 3.5 Flash 在 OpenRouter 上完全免费——零输入、零输出费用——同时采用 MoE 架构(196B 参数中仅激活 11B),在保持低延迟的同时提供了远超体量的推理能力。它还是一个推理模型(reasoning model),支持 256K 上下文窗口。
对于每天让 OpenClaw 自动发送消息、检索信息、整理文件的普通用户来说,Step 3.5 Flash 「白嫖到顶配」的性价比是无法拒绝的。它一个人就吃掉了 OpenClaw 近四分之一的总流量。
$0 / $0完全免费
256K上下文
MoE稀疏架构
2 GLM-5 Turbo 中国 Agent 专项优化
Z.ai(智谱)专为 OpenClaw 训练优化
2.24T tokens
为什么排第二:唯一一个从训练阶段就针对 OpenClaw 深度优化的模型。智谱不仅推出了 GLM-5 Turbo,还基于 GLM-5 架构打造了桌面一键安装工具 AutoClaw,内置 50+ 预装技能和专属微调模型 Pony Alpha 2。在 GLM-5 Turbo 正式发布前,智谱就通过匿名模型「Pony Alpha」在 OpenRouter 上压力测试,首日处理了超过 400 亿 token。
GLM-5 Turbo 在工具调用稳定性、复杂指令分解、定时任务和长链执行方面做了系统级优化。智谱还发布了 ZClawBench 评测基准,专门衡量模型在 OpenClaw 工作流中的表现。对于需要可靠执行多步骤任务的用户来说,这种「原生适配」的优势是通用模型无法比拟的。
$1.20 / $4每百万 token
203K上下文
ZClawBench专项评测
3 MiMo-V2-Pro 中国
小米 Xiaomi1T 参数 · 前身 Hunter Alpha
2.15T tokens
为什么排第三:「Hunter Alpha 事件」制造了病毒式传播,实力也确实过硬。2026 年 3 月,一个匿名的 1T 参数模型以「Hunter Alpha」身份出现在 OpenRouter,迅速登顶排行榜,被广泛猜测为 DeepSeek V4。3 月 18 日,小米 MiMo 负责人罗浮力揭晓真相——这是 MiMo-V2-Pro 的内部测试版。小米股价当天上涨 5.8%。
MiMo-V2-Pro 在 SWE-bench Verified 上得分 78%(接近 Claude Sonnet 4.6 的 79.6%),ClawEval 智能体评测得分 61.5(Opus 4.6 为 66.3),但价格只要 $1/$3——Sonnet 的三分之一。结合 1M 上下文窗口和小米提供的一键 OpenClaw 云端部署体验,它成为了追求「接近旗舰水准但预算有限」用户的首选。
$1 / $3每百万 token
1M上下文
78%SWE-bench
4 MiniMax M2.5 FREE 中国
MiniMaxSWE-bench 80.2%
1.06T tokens
为什么排第四:免费且是唯一擅长办公文件操作的模型。M2.5 在 SWE-bench Verified 上得分 80.2%,超过了 Claude Sonnet 4.6(79.6%),但在 OpenRouter 上完全免费。更独特的是,它被训练在真实的数字办公环境中——能流畅地生成和操作 Word、Excel、PowerPoint 文件,在不同软件环境间切换,并与其他 Agent 协作。
对于用 OpenClaw 自动化办公流程(生成周报、整理数据表格、制作汇报 PPT)的用户来说,M2.5 的这种「办公原生能力」是其他模型不具备的。免费 + 办公专精 = 独特生态位。
$0 / $0完全免费
197K上下文
80.2%SWE-bench
5 Claude Sonnet 4.6 美国
Anthropic西方模型中排名第一
1.03T tokens
为什么排第五:Agent 领域的「质量标杆」,Tool calling 最可靠。在付费模型中,Sonnet 4.6 是 OpenClaw 上消耗量最大的。Claude 在工具调用(tool calling)和指令跟随方面的可靠性被公认为业界最佳——Agent 框架最怕的就是模型在中间步骤「搞砸语法」或「遗忘上下文」,而 Sonnet 在这方面最稳定。
SWE-bench 79.6% 的编码能力加上 $3/$15 的中等价格,使其成为「不愿冒险用免费模型,又觉得 Opus 太贵」的付费用户的默认选择。Anthropic 虽然后来禁止了 Claude Max 订阅直接用于 OpenClaw,但通过 API 仍然是支持的。
$3 / $15每百万 token
1M β上下文
79.6%SWE-bench
6 Hunter Alpha Agent 专项
OpenRouter1T 参数 · 已揭晓为 MiMo-V2-Pro 测试版
~800B tokens
为什么仍单独上榜:Hunter Alpha 在被揭晓身份之前作为独立模型 ID 积累了大量使用量。虽然本质是 MiMo-V2-Pro 的早期版本,但在 OpenRouter 上它仍作为独立端点存在,且所有 prompt 和回复均会被记录用于模型改进。部分用户因为「先入为主」的习惯仍在使用这个端点。
7 Arcee Trinity Large Preview FREE 美国
Arcee AI400B MoE / 13B 激活
769B tokens
为什么排第七:免费的「全能型」开源模型。Trinity 是另一个受益于 OpenRouter 免费额度的模型。400B 参数、4/256 专家路由,仅激活 13B 参数。它在创意写作、角色扮演方面比同类推理模型更强,同时也专门训练了对 OpenCode、Cline、Kilo Code 等 Agent 工具链的适配能力。128K 上下文在免费模型中属于主流水平。
$0 / $0完全免费
128K上下文
400BMoE
8 Claude Opus 4.6 美国
Anthropic当前最强旗舰
705B tokens
为什么排第八而非更高:太贵。Opus 4.6 是公认的最强 Agent 模型(OSWorld 72.7%、SWE-bench 80.8%、GPQA 91.3%),但 $5/$25 的价格是 MiMo-V2-Pro 的 5-8 倍。OpenClaw 每次对话都会发送完整历史记录,token 消耗飞速增长。因此 Opus 主要被两类用户使用:企业团队(不差钱)和需要处理超复杂任务的高端用户(如多日代码重构、整体架构设计)。大多数人把 Opus 作为「遇到硬骨头时切换」的备选,而非日常默认。
$5 / $25每百万 token
1M上下文
80.8%SWE-bench
9 MiniMax M2.7 中国
MiniMaxM2.5 的下一代
675B tokens
为什么排第九:M2.5 的付费升级版,多 Agent 协作能力更强。M2.7 在 SWE-Pro 上得分 56.2%、Terminal Bench 2 得分 57.0%,多 Agent 系统评测 GDPval-AA 达到 1495 ELO。它支持实时调试、根因分析、财务建模和全格式文档生成,价格仅 $0.30/$1.20——比免费的 M2.5 更强但也极其便宜。增长势头很猛(月环比 +148%)。
$0.30 / $1.20每百万 token
205K上下文
+148%月增长
10 Kimi K2.5 中国
MoonshotAI 月之暗面社区投票第一
672B tokens
为什么排第十:视觉编码 + Agent Swarm 的独特定位。K2.5 是原生多模态模型,具备业界领先的视觉编码能力(visual coding)和自主 Agent 群体协作范式(agent swarm)。在需要「看懂屏幕截图然后写代码」的 OpenClaw 场景中表现突出。$0.42/$2.20 的低价和在社区投票中排名第一的口碑,使其成为中国 AI 模型在 OpenClaw 生态中的又一支强军。
$0.42 / $2.20每百万 token
262K上下文
多模态原生视觉
11 Gemini 3 Flash Preview 美国
Google接近 Pro 水准的性价比
574B tokens
为什么排十一:Google 生态用户的首选。Gemini 3 Flash 在推理和工具调用上接近 Pro 水准,但延迟更低、价格更便宜($0.50/$3)。1M 上下文窗口和可配置的 thinking levels(minimal/low/medium/high)让用户可以按任务复杂度动态调节推理深度和成本。对于已深度嵌入 Google 生态(Gmail、Calendar、Drive)的 OpenClaw 用户,Gemini 是天然选择。
$0.50 / $3每百万 token
1M上下文
Thinking Levels可配置推理
12 NVIDIA Nemotron 3 Super FREE 美国
NVIDIA120B MoE / 12B 激活 · 开源
329B tokens
为什么排十二:硬件巨头的免费开源方案。NVIDIA 的混合 Mamba-Transformer MoE 架构,1M 上下文窗口,完全开源(NVIDIA Open License)。在 AIME 2025、TerminalBench、SWE-Bench Verified 上均有领先表现。对于想要自托管 + 免费 + 长上下文的技术型用户,Nemotron 是绝佳选择。
13 MiMo-V2-Omni 中国
小米 XiaomiMiMo-V2-Pro 的全模态版本
320B tokens
为什么排十三:唯一的原生全模态 Agent 模型。Omni 与 Pro 共享底层架构,但原生处理图像、视频和音频输入——不是通过外挂模块,而是端到端统一训练。在 PinchBench 上得分 81.2(全球第二),仅次于 Opus 4.6。$0.40/$2 的价格,适合需要 OpenClaw 处理视觉任务(如网页截图分析、视频内容理解)的用户。
14 DeepSeek V3.2 中国
DeepSeekGPT-5 级推理 · 极致低价
309B tokens
为什么排十四:最便宜的前沿推理模型。$0.26/$0.38 的价格令人咋舌——比几乎所有竞品便宜 10 倍以上。V3.2 引入了 DeepSeek Sparse Attention(DSA)机制,在 2025 年 IMO 和 IOI 上获得金牌级别成绩。支持通过 reasoning.enabled 参数控制是否启用链式推理。但它的排名不及前列中国模型,可能与 OpenClaw 对 Agent 专项优化的需求有关——DeepSeek 更偏向纯推理而非 Agent 工作流。
$0.26 / $0.38每百万 token
164K上下文
第 15-20 名速览
15 Gemini 2.5 Flash Lite
Google · $0.10/$0.40
253B
Google 最便宜的推理模型,适合 OpenClaw 中的轻量级子任务和高频路由。默认关闭思考模式以追求速度。
16 GPT-5 Nano
OpenAI · $0.05/$0.40
223B
OpenAI 最小最快的模型。在 OpenClaw 中常被用作分类器和路由器——判断用户意图后再分发给更强的模型。400K 上下文是同价位最大的。
17 Healer Alpha
OpenRouter · 全模态
~200B
OpenRouter 自营的全模态 Agent 模型,与 Hunter Alpha 类似但侧重视觉和音频感知。所有 prompt 均被记录。
18 Claude Haiku 4.5
Anthropic · $1/$5
199B
Anthropic 最快的模型,SWE-bench 73%+。在 OpenClaw 中常作为子 Agent 使用——主模型把简单任务分配给 Haiku 以节省成本,实现 Opus + Haiku 的分层架构。
19 Gemini 2.5 Flash
Google · $0.30/$2.50
192B
上一代 Gemini 主力模型,仍有大量用户未迁移到 3.0 版本。内置 thinking 能力,1M 上下文。
20 Claude Sonnet 4.5
Anthropic · $3/$15
185B
Sonnet 4.6 的前代,仍有用户因配置惯性和 Sonnet 4.5 在 Computer Use 方面的先发优势而保留使用。
排名背后的五大趋势
🇨🇳 中国模型统治 Agent 赛道
Top 10 中有 6 个来自中国厂商(StepFun、智谱、小米、MiniMax×2、月之暗面)。它们通过极低定价、免费额度和专门为 OpenClaw 优化的训练策略,占据了大部分使用量。
💸 免费模型吃掉近半流量
Step 3.5 Flash、MiniMax M2.5、Trinity、Nemotron 四个免费模型合计贡献超过 5.5T token,占 OpenClaw 总量的约 30%。Agent 的 24/7 特性使得成本敏感度远高于普通聊天场景。
🎯 「Agent 专项优化」成新趋势
智谱 GLM-5 Turbo、小米 MiMo-V2-Pro 都在产品定位中明确强调「为 OpenClaw 优化」。从训练数据、评测基准到一键部署工具,形成了「模型 + Agent 框架」的深度绑定。
👑 Claude 仍是质量天花板
Sonnet + Opus + Haiku 三个 Claude 模型合计约 1.9T token,是 OpenClaw 上最大的单一付费品牌。尽管中国模型在量上领先,但需要最高可靠性的用户仍选择 Claude。
🔀 分层路由成为主流架构
很多用户采用「轻量模型做路由 + 重量模型做执行」的混合策略。例如 GPT-5 Nano 做意图分类、Haiku 处理简单任务、Sonnet/Opus 处理复杂任务。这解释了为什么低价模型和高价模型同时上榜。
💡 选型建议:如果你刚开始使用 OpenClaw,建议从 Step 3.5 Flash(免费)或 GLM-5 Turbo(低价 + Agent 专项优化)入手。需要更高质量时切换到 Claude Sonnet 4.6。遇到超复杂任务再调用 Opus 4.6 或 MiMo-V2-Pro。这种分层策略可以在保证质量的同时将成本降低 60-80%。
数据来源
本文排名数据来自 OpenRouter - Top AI Models Used by OpenClaw,基于过去 30 天的真实 token 使用量(2026 年 4 月更新)。各模型描述和定价参考了对应厂商的官方文档和 OpenRouter 模型页面。
相关链接:
排名数据随时变动,本文反映 2026 年 4 月初的快照。
最后更新:2026 年 4 月 1 日