OpenClaw 模型使用量排名解读：谁在驱动 2026 年最火的 AI Agent？

OpenClaw 模型使用量排名解读：谁在驱动 2026 年最火的 AI Agent

🦞 OpenRouter × OpenClaw

OpenClaw 模型使用量排名解读

谁在驱动 2026 年最火的 AI Agent？

基于 OpenRouter 公开的真实 token 消耗数据（2026 年 4 月更新），深度解析 OpenClaw 用户最青睐的 20 个模型及其排名背后的逻辑。

OpenRouter × OpenClaw 总 token 消耗: 18.1T

什么是 OpenClaw？

OpenClaw（前身 Clawdbot）是 2026 年最火的开源 AI Agent 平台，在 OpenRouter 应用排行榜上以 18.1T token 的累计消耗量排名全球第一，远超第二名 Kilo Code（5.75T）和第三名 Claude Code（2.25T）。它能在本地运行，连接 WhatsApp、Discord、Slack 等即时通讯工具，通过浏览器自动化、Shell 命令执行和持久记忆，24/7 执行日常工作。

OpenClaw 通过 OpenRouter 接入了 347 个模型。下面的排名基于过去 30 天的真实 token 使用量，反映了全球用户的实际偏好。

Top 20 模型使用量排名

1 Step 3.5 Flash FREE 中国

StepFun 阶跃星辰196B MoE / 11B 激活

3.4T tokens

为什么排第一：完全免费 + 推理能力出色。OpenClaw 是一个 24/7 运行的 Agent，每天产生大量 token。对于绝大多数用户来说，成本是首要考量。Step 3.5 Flash 在 OpenRouter 上完全免费——零输入、零输出费用——同时采用 MoE 架构（196B 参数中仅激活 11B），在保持低延迟的同时提供了远超体量的推理能力。它还是一个推理模型（reasoning model），支持 256K 上下文窗口。

对于每天让 OpenClaw 自动发送消息、检索信息、整理文件的普通用户来说，Step 3.5 Flash 「白嫖到顶配」的性价比是无法拒绝的。它一个人就吃掉了 OpenClaw 近四分之一的总流量。

$0 / $0完全免费

256K上下文

MoE稀疏架构

2 GLM-5 Turbo 中国 Agent 专项优化

Z.ai（智谱）专为 OpenClaw 训练优化

2.24T tokens

为什么排第二：唯一一个从训练阶段就针对 OpenClaw 深度优化的模型。智谱不仅推出了 GLM-5 Turbo，还基于 GLM-5 架构打造了桌面一键安装工具 AutoClaw，内置 50+ 预装技能和专属微调模型 Pony Alpha 2。在 GLM-5 Turbo 正式发布前，智谱就通过匿名模型「Pony Alpha」在 OpenRouter 上压力测试，首日处理了超过 400 亿 token。

GLM-5 Turbo 在工具调用稳定性、复杂指令分解、定时任务和长链执行方面做了系统级优化。智谱还发布了 ZClawBench 评测基准，专门衡量模型在 OpenClaw 工作流中的表现。对于需要可靠执行多步骤任务的用户来说，这种「原生适配」的优势是通用模型无法比拟的。

$1.20 / $4每百万 token

203K上下文

ZClawBench专项评测

3 MiMo-V2-Pro 中国

小米 Xiaomi1T 参数 · 前身 Hunter Alpha

2.15T tokens

为什么排第三：「Hunter Alpha 事件」制造了病毒式传播，实力也确实过硬。2026 年 3 月，一个匿名的 1T 参数模型以「Hunter Alpha」身份出现在 OpenRouter，迅速登顶排行榜，被广泛猜测为 DeepSeek V4。3 月 18 日，小米 MiMo 负责人罗浮力揭晓真相——这是 MiMo-V2-Pro 的内部测试版。小米股价当天上涨 5.8%。

MiMo-V2-Pro 在 SWE-bench Verified 上得分 78%（接近 Claude Sonnet 4.6 的 79.6%），ClawEval 智能体评测得分 61.5（Opus 4.6 为 66.3），但价格只要 $1/$3——Sonnet 的三分之一。结合 1M 上下文窗口和小米提供的一键 OpenClaw 云端部署体验，它成为了追求「接近旗舰水准但预算有限」用户的首选。

$1 / $3每百万 token

1M上下文

78%SWE-bench

4 MiniMax M2.5 FREE 中国

MiniMaxSWE-bench 80.2%

1.06T tokens

为什么排第四：免费且是唯一擅长办公文件操作的模型。M2.5 在 SWE-bench Verified 上得分 80.2%，超过了 Claude Sonnet 4.6（79.6%），但在 OpenRouter 上完全免费。更独特的是，它被训练在真实的数字办公环境中——能流畅地生成和操作 Word、Excel、PowerPoint 文件，在不同软件环境间切换，并与其他 Agent 协作。

对于用 OpenClaw 自动化办公流程（生成周报、整理数据表格、制作汇报 PPT）的用户来说，M2.5 的这种「办公原生能力」是其他模型不具备的。免费 + 办公专精 = 独特生态位。

$0 / $0完全免费

197K上下文

80.2%SWE-bench

5 Claude Sonnet 4.6 美国

Anthropic西方模型中排名第一

1.03T tokens

为什么排第五：Agent 领域的「质量标杆」，Tool calling 最可靠。在付费模型中，Sonnet 4.6 是 OpenClaw 上消耗量最大的。Claude 在工具调用（tool calling）和指令跟随方面的可靠性被公认为业界最佳——Agent 框架最怕的就是模型在中间步骤「搞砸语法」或「遗忘上下文」，而 Sonnet 在这方面最稳定。

SWE-bench 79.6% 的编码能力加上 $3/$15 的中等价格，使其成为「不愿冒险用免费模型，又觉得 Opus 太贵」的付费用户的默认选择。Anthropic 虽然后来禁止了 Claude Max 订阅直接用于 OpenClaw，但通过 API 仍然是支持的。

$3 / $15每百万 token

1M β上下文

79.6%SWE-bench

6 Hunter Alpha Agent 专项

OpenRouter1T 参数 · 已揭晓为 MiMo-V2-Pro 测试版

~800B tokens

为什么仍单独上榜：Hunter Alpha 在被揭晓身份之前作为独立模型 ID 积累了大量使用量。虽然本质是 MiMo-V2-Pro 的早期版本，但在 OpenRouter 上它仍作为独立端点存在，且所有 prompt 和回复均会被记录用于模型改进。部分用户因为「先入为主」的习惯仍在使用这个端点。

7 Arcee Trinity Large Preview FREE 美国

Arcee AI400B MoE / 13B 激活

769B tokens

为什么排第七：免费的「全能型」开源模型。Trinity 是另一个受益于 OpenRouter 免费额度的模型。400B 参数、4/256 专家路由，仅激活 13B 参数。它在创意写作、角色扮演方面比同类推理模型更强，同时也专门训练了对 OpenCode、Cline、Kilo Code 等 Agent 工具链的适配能力。128K 上下文在免费模型中属于主流水平。

$0 / $0完全免费

128K上下文

400BMoE

8 Claude Opus 4.6 美国

Anthropic当前最强旗舰

705B tokens

为什么排第八而非更高：太贵。Opus 4.6 是公认的最强 Agent 模型（OSWorld 72.7%、SWE-bench 80.8%、GPQA 91.3%），但 $5/$25 的价格是 MiMo-V2-Pro 的 5-8 倍。OpenClaw 每次对话都会发送完整历史记录，token 消耗飞速增长。因此 Opus 主要被两类用户使用：企业团队（不差钱）和需要处理超复杂任务的高端用户（如多日代码重构、整体架构设计）。大多数人把 Opus 作为「遇到硬骨头时切换」的备选，而非日常默认。

$5 / $25每百万 token

1M上下文

80.8%SWE-bench

9 MiniMax M2.7 中国

MiniMaxM2.5 的下一代

675B tokens

为什么排第九：M2.5 的付费升级版，多 Agent 协作能力更强。M2.7 在 SWE-Pro 上得分 56.2%、Terminal Bench 2 得分 57.0%，多 Agent 系统评测 GDPval-AA 达到 1495 ELO。它支持实时调试、根因分析、财务建模和全格式文档生成，价格仅 $0.30/$1.20——比免费的 M2.5 更强但也极其便宜。增长势头很猛（月环比 +148%）。

$0.30 / $1.20每百万 token

205K上下文

+148%月增长

10 Kimi K2.5 中国

MoonshotAI 月之暗面社区投票第一

672B tokens

为什么排第十：视觉编码 + Agent Swarm 的独特定位。K2.5 是原生多模态模型，具备业界领先的视觉编码能力（visual coding）和自主 Agent 群体协作范式（agent swarm）。在需要「看懂屏幕截图然后写代码」的 OpenClaw 场景中表现突出。$0.42/$2.20 的低价和在社区投票中排名第一的口碑，使其成为中国 AI 模型在 OpenClaw 生态中的又一支强军。

$0.42 / $2.20每百万 token

262K上下文

多模态原生视觉

11 Gemini 3 Flash Preview 美国

Google接近 Pro 水准的性价比

574B tokens

为什么排十一：Google 生态用户的首选。Gemini 3 Flash 在推理和工具调用上接近 Pro 水准，但延迟更低、价格更便宜（$0.50/$3）。1M 上下文窗口和可配置的 thinking levels（minimal/low/medium/high）让用户可以按任务复杂度动态调节推理深度和成本。对于已深度嵌入 Google 生态（Gmail、Calendar、Drive）的 OpenClaw 用户，Gemini 是天然选择。

$0.50 / $3每百万 token

1M上下文

Thinking Levels可配置推理

12 NVIDIA Nemotron 3 Super FREE 美国

NVIDIA120B MoE / 12B 激活 · 开源

329B tokens

为什么排十二：硬件巨头的免费开源方案。NVIDIA 的混合 Mamba-Transformer MoE 架构，1M 上下文窗口，完全开源（NVIDIA Open License）。在 AIME 2025、TerminalBench、SWE-Bench Verified 上均有领先表现。对于想要自托管 + 免费 + 长上下文的技术型用户，Nemotron 是绝佳选择。

13 MiMo-V2-Omni 中国

小米 XiaomiMiMo-V2-Pro 的全模态版本

320B tokens

为什么排十三：唯一的原生全模态 Agent 模型。Omni 与 Pro 共享底层架构，但原生处理图像、视频和音频输入——不是通过外挂模块，而是端到端统一训练。在 PinchBench 上得分 81.2（全球第二），仅次于 Opus 4.6。$0.40/$2 的价格，适合需要 OpenClaw 处理视觉任务（如网页截图分析、视频内容理解）的用户。

14 DeepSeek V3.2 中国

DeepSeekGPT-5 级推理 · 极致低价

309B tokens

为什么排十四：最便宜的前沿推理模型。$0.26/$0.38 的价格令人咋舌——比几乎所有竞品便宜 10 倍以上。V3.2 引入了 DeepSeek Sparse Attention（DSA）机制，在 2025 年 IMO 和 IOI 上获得金牌级别成绩。支持通过 reasoning.enabled 参数控制是否启用链式推理。但它的排名不及前列中国模型，可能与 OpenClaw 对 Agent 专项优化的需求有关——DeepSeek 更偏向纯推理而非 Agent 工作流。

$0.26 / $0.38每百万 token

164K上下文

第 15-20 名速览

15 Gemini 2.5 Flash Lite

Google · $0.10/$0.40

253B

Google 最便宜的推理模型，适合 OpenClaw 中的轻量级子任务和高频路由。默认关闭思考模式以追求速度。

16 GPT-5 Nano

OpenAI · $0.05/$0.40

223B

OpenAI 最小最快的模型。在 OpenClaw 中常被用作分类器和路由器——判断用户意图后再分发给更强的模型。400K 上下文是同价位最大的。

17 Healer Alpha

OpenRouter · 全模态

~200B

OpenRouter 自营的全模态 Agent 模型，与 Hunter Alpha 类似但侧重视觉和音频感知。所有 prompt 均被记录。

18 Claude Haiku 4.5

Anthropic · $1/$5

199B

Anthropic 最快的模型，SWE-bench 73%+。在 OpenClaw 中常作为子 Agent 使用——主模型把简单任务分配给 Haiku 以节省成本，实现 Opus + Haiku 的分层架构。

19 Gemini 2.5 Flash

Google · $0.30/$2.50

192B

上一代 Gemini 主力模型，仍有大量用户未迁移到 3.0 版本。内置 thinking 能力，1M 上下文。

20 Claude Sonnet 4.5

Anthropic · $3/$15

185B

Sonnet 4.6 的前代，仍有用户因配置惯性和 Sonnet 4.5 在 Computer Use 方面的先发优势而保留使用。

排名背后的五大趋势

🇨🇳 中国模型统治 Agent 赛道

Top 10 中有 6 个来自中国厂商（StepFun、智谱、小米、MiniMax×2、月之暗面）。它们通过极低定价、免费额度和专门为 OpenClaw 优化的训练策略，占据了大部分使用量。

💸 免费模型吃掉近半流量

Step 3.5 Flash、MiniMax M2.5、Trinity、Nemotron 四个免费模型合计贡献超过 5.5T token，占 OpenClaw 总量的约 30%。Agent 的 24/7 特性使得成本敏感度远高于普通聊天场景。

🎯 「Agent 专项优化」成新趋势

智谱 GLM-5 Turbo、小米 MiMo-V2-Pro 都在产品定位中明确强调「为 OpenClaw 优化」。从训练数据、评测基准到一键部署工具，形成了「模型 + Agent 框架」的深度绑定。

👑 Claude 仍是质量天花板

Sonnet + Opus + Haiku 三个 Claude 模型合计约 1.9T token，是 OpenClaw 上最大的单一付费品牌。尽管中国模型在量上领先，但需要最高可靠性的用户仍选择 Claude。

🔀 分层路由成为主流架构

很多用户采用「轻量模型做路由 + 重量模型做执行」的混合策略。例如 GPT-5 Nano 做意图分类、Haiku 处理简单任务、Sonnet/Opus 处理复杂任务。这解释了为什么低价模型和高价模型同时上榜。

💡 选型建议：如果你刚开始使用 OpenClaw，建议从 Step 3.5 Flash（免费）或 GLM-5 Turbo（低价 + Agent 专项优化）入手。需要更高质量时切换到 Claude Sonnet 4.6。遇到超复杂任务再调用 Opus 4.6 或 MiMo-V2-Pro。这种分层策略可以在保证质量的同时将成本降低 60-80%。

数据来源

本文排名数据来自 OpenRouter - Top AI Models Used by OpenClaw，基于过去 30 天的真实 token 使用量（2026 年 4 月更新）。各模型描述和定价参考了对应厂商的官方文档和 OpenRouter 模型页面。

OpenClaw 模型使用量排名解读：谁在驱动 2026 年最火的 AI Agent？

OpenClaw 模型使用量排名解读

什么是 OpenClaw？

Top 20 模型使用量排名

1 Step 3.5 Flash FREE 中国

2 GLM-5 Turbo 中国 Agent 专项优化

3 MiMo-V2-Pro 中国

4 MiniMax M2.5 FREE 中国

5 Claude Sonnet 4.6 美国

6 Hunter Alpha Agent 专项

7 Arcee Trinity Large Preview FREE 美国

8 Claude Opus 4.6 美国

9 MiniMax M2.7 中国

10 Kimi K2.5 中国

11 Gemini 3 Flash Preview 美国

12 NVIDIA Nemotron 3 Super FREE 美国

13 MiMo-V2-Omni 中国

14 DeepSeek V3.2 中国

第 15-20 名速览

15 Gemini 2.5 Flash Lite

16 GPT-5 Nano

17 Healer Alpha

18 Claude Haiku 4.5

19 Gemini 2.5 Flash

20 Claude Sonnet 4.5

排名背后的五大趋势

🇨🇳 中国模型统治 Agent 赛道

💸 免费模型吃掉近半流量

🎯 「Agent 专项优化」成新趋势

👑 Claude 仍是质量天花板

🔀 分层路由成为主流架构

数据来源

2026-04-01

2026 年三大 AI 模型详解：ChatGPT vs Claude vs Gemini 如何选择

2026-03-22

OpenClaw 通过 OpenRouter 接入 Kimi、智谱 GLM-5、MiniMax

2025-11-24

主流 AI Agent CLI 终端对比