Hermes Agent 模型使用量排名解读：Nous Research 如何搅动 AI Agent 格局？

🧠 OpenRouter × Hermes Agent

Nous Research 的自进化 Agent 如何在一个月内冲上 OpenRouter 全球第四？

基于 OpenRouter 公开的真实 token 消耗数据（2026 年 4 月更新），解析 Hermes Agent 用户最青睐的模型及其排名逻辑。

指标	数据
总 token 消耗	~1T
OpenRouter 全球日榜	#4
接入模型数	229
周增长率	+498%

什么是 Hermes Agent？

Hermes Agent 是 Nous Research（获 5000 万美元融资的 AI 实验室，Hermes 系列模型的缔造者）于 2026 年 2 月开源的自进化 AI Agent 平台。它与 OpenClaw 定位类似，但核心差异在于「学习循环」——Agent 能在完成复杂任务后自主创建可复用技能、周期性整理记忆、并通过 Honcho 用户建模逐渐理解你的工作方式。

Hermes Agent 支持 Telegram、Discord、Slack、WhatsApp、Signal、Email 和 CLI 等多平台接入，通过 OpenRouter 可使用 200+ 模型，也支持 Nous Portal、Anthropic、OpenAI、智谱、Kimi、MiniMax 等直连接入。GitHub 上已有约 8,700 星，245 位贡献者。

⚡ 与 OpenClaw 的对比： OpenClaw（18.1T tokens，全球第一）的优势在于生态规模——346K 星、44K 技能、50+ 平台。Hermes Agent 的优势则在于自学习能力（零 CVE 安全记录）和更低的运营成本（支持 serverless 后端，$5/月起）。两者同为 MIT 协议，可共存于同一台服务器。Hermes 甚至提供了 hermes claw migrate 命令，一键从 OpenClaw 迁移。

Top 10 模型使用量排名

以下排名基于 Hermes Agent 在 OpenRouter 上过去 30 天的真实 token 使用量。与 OpenClaw 排名不同的是，Hermes 的用户群体更偏向技术型开发者和 AI 研究者，这一用户画像深刻影响了模型偏好。

1 Claude Sonnet 4.6 `美国`

Anthropic · Hermes Agent 上消耗量第一的模型

~180B tokens

为什么排第一：Hermes 用户更看重可靠性而非价格。 与 OpenClaw 用户群体不同，Hermes Agent 用户以开发者和技术人员为主，他们更在意工具调用（tool calling）的稳定性和指令跟随能力，而非极致的成本控制。Claude Sonnet 在这两方面被公认为业界最佳——Agent 框架最怕的就是模型在多步骤任务中「搞砸语法」，而 Sonnet 在这方面最稳定。Hermes 的技能自动创建和记忆整理功能高度依赖模型对复杂结构化输出的精确处理，这正是 Sonnet 的长板。Nous Research 的文档也将 Claude 列为推荐选择之一。

价格	上下文	SWE-bench
$3 / $15 每百万 token	1M β	79.6%

2 GLM-5 Turbo `中国` `Agent 优化`

Z.ai（智谱）· Agent 专项训练优化

~140B tokens

为什么排第二：Hermes 原生支持智谱直连，Agent 工作流零摩擦。 Hermes Agent 的 provider 列表中 zai 是一级支持——不需要通过 OpenRouter 中转，直接调用智谱 API。GLM-5 Turbo 本身就是为 Agent 场景训练优化的模型，在工具调用稳定性和复杂指令分解方面做了系统级优化。结合 $1.20/$4 的低价和 203K 上下文，它成为 Hermes 用户在「需要可靠执行但预算敏感」场景下的首选。智谱还推出了 ZClawBench 评测和一键部署工具 AutoClaw，在 Agent 生态建设上投入最为激进。

价格	上下文	特性
$1.20 / $4 每百万 token	203K	Hermes 原生直连

3 Step 3.5 Flash `中国` `FREE`

StepFun 阶跃星辰 · 196B MoE / 11B 激活

~120B tokens

为什么排第三（而非 OpenClaw 上的第一）：Hermes 用户更谨慎。 在 OpenClaw 上，Step 3.5 Flash 凭借「完全免费 + 推理能力出色」独占近四分之一流量。但 Hermes Agent 的用户群体以开发者为主，对免费模型的「数据被收集用于模型改进」更加敏感（Step 3.5 Flash 明确标注 prompt 和 completion 数据会被收集）。尽管如此，零成本 + 256K 上下文 + MoE 推理的组合仍然极具吸引力，尤其是在 Hermes 的 smart routing 配置中，很多用户将它设为 cheap_model 处理简单任务。

价格	上下文	架构
$0 / $0 完全免费	256K	MoE 稀疏架构

4 Claude Opus 4.6 `美国`

Anthropic · 当前最强旗舰

~95B tokens

为什么 Opus 在 Hermes 上排名比 OpenClaw 高得多：研究型用户不差钱。 在 OpenClaw 上 Opus 排第八，因为大部分用户是普通消费者，$5/$25 的价格让人望而却步。但 Hermes Agent 的用户中有大量 AI 研究者（Nous Research 本身就是研究机构，Hermes 内置了 Atropos RL 训练和 trajectory 生成工具），他们把 Opus 作为生成高质量训练数据的「旗舰模型」。Opus 在 OSWorld 72.7%、SWE-bench 80.8% 的表现使其成为处理复杂代码重构、架构设计等任务的不二之选。

价格	上下文	SWE-bench
$5 / $25 每百万 token	1M	80.8%

5 MiMo-V2-Pro `中国`

小米 Xiaomi · 1T 参数 · 前身 Hunter Alpha

~80B tokens

为什么排第五：性价比之王，Sonnet 的平替。 MiMo-V2-Pro 在 SWE-bench 上得分 78%（接近 Sonnet 的 79.6%），但价格只要 $1/$3——Sonnet 的三分之一。1M 上下文窗口对 Hermes 的长对话和跨会话记忆尤为重要。对于不需要 Claude 级别工具调用稳定性的任务，MiMo 提供了几乎相同的代码能力，代价却低得多。Hunter Alpha 事件带来的病毒式传播也为它积累了初始用户。

价格	上下文	SWE-bench
$1 / $3 每百万 token	1M	78%

6 Gemini 3 Flash Preview `美国`

Google · 可配置推理深度

~65B tokens

为什么排第六：Hermes 的 smart routing 天然适配 Gemini 的 thinking levels。 Hermes Agent 内置了 smart_model_routing 功能——简单任务走便宜模型，复杂任务走旗舰模型。Gemini 3 Flash 的可配置推理深度（minimal/low/medium/high）与这种分层路由策略完美契合：简单查询用 minimal thinking 快速响应，复杂推理切到 high thinking。$0.50/$3 的中等价格和 1M 上下文使其成为「默认辅助模型」的热门选择。Hermes 文档中 Gemini Flash 也被用作默认的 auxiliary model。

价格	上下文	特性
$0.50 / $3 每百万 token	1M	Thinking Levels 可配置推理

7 DeepSeek V3.2 `中国`

DeepSeek · GPT-5 级推理 · 极致低价

~55B tokens

为什么在 Hermes 上排名高于 OpenClaw：DeepSeek 直连支持。 Hermes Agent 将 deepseek 列为一级 provider，无需 OpenRouter 中转即可直连 DeepSeek API。$0.26/$0.38 的价格几乎是市场最低——比竞品便宜 10 倍以上。V3.2 引入的 Sparse Attention 机制在数学和竞赛推理上表现突出（2025 IMO/IOI 金牌级），但在纯 Agent 工作流方面不如专门优化的 GLM-5 Turbo。很多 Hermes 用户将 DeepSeek 作为 fallback provider 或 cheap_model 使用。

价格	上下文	特性
$0.26 / $0.38 每百万 token	164K	Hermes 原生直连

8 Kimi K2.5 `中国`

MoonshotAI 月之暗面 · 原生多模态

~45B tokens

为什么排第八：视觉编码能力与 Hermes 的浏览器自动化工具深度互补。 Hermes Agent 内置了浏览器自动化和 vision 工具，K2.5 的原生多模态视觉编码能力（visual coding）让 Agent 能「看懂网页截图然后写代码操作」。Hermes 也将 kimi-coding 列为一级 provider，支持直连月之暗面 API。$0.42/$2.20 的价格和 262K 上下文，加上 Agent Swarm 协作范式，使 K2.5 在多 Agent 并行任务场景中表现突出——这恰好是 Hermes 的 parallel subagent delegation 功能的理想搭档。

价格	上下文	特性
$0.42 / $2.20 每百万 token	262K	原生多模态视觉

9 MiniMax M2.5 `中国` `FREE`

MiniMax · SWE-bench 80.2%

~40B tokens

为什么在 Hermes 上排名低于 OpenClaw：Hermes 用户更少做办公自动化。 M2.5 在 OpenClaw 上排第四，主要得益于其独特的办公文件操作能力（Word、Excel、PPT 生成）。但 Hermes Agent 的用户更偏向开发和研究场景而非办公自动化，这削弱了 M2.5 的差异化优势。尽管如此，免费 + SWE-bench 80.2%（超 Sonnet 4.6 的 79.6%）的硬实力仍使其保持在前十。Hermes 将 minimax 和 minimax-cn 作为一级 provider 支持。

价格	上下文	SWE-bench
$0 / $0 完全免费	197K	80.2%

10 Hermes 3 405B Instruct `Nous` `FREE`

Nous Research · Llama 3.1 405B 微调

~35B tokens

为什么排第十：自家模型的「主场优势」。 这是 Nous Research 基于 Llama 3.1 405B 打造的旗舰微调模型，专注于 Agent 能力、工具调用和角色扮演。在 OpenRouter 上完全免费。作为 Hermes Agent 的「亲儿子」模型，它在 Hermes 的 prompt 格式、工具调用约定和技能系统方面具有天然的适配优势——毕竟 Hermes Agent 的名字就来自 Hermes 模型系列。通过 Nous Portal 使用时还享有零配置的 OAuth 认证和 400+ 模型访问。虽然绝对性能不及前沿闭源模型，但「免费 + 原生适配 + 无数据收集」的组合吸引了注重隐私的用户。

价格	上下文	参数量
$0 / $0 完全免费	131K	405B 全参数微调

第 11–15 名速览

11. NVIDIA Nemotron 3 Super FREE — ~28B tokens NVIDIA · 120B MoE / 12B 激活 · 1M 上下文 · 完全开源。混合 Mamba-Transformer 架构适合自托管用户。Hermes 的 Docker/SSH 终端后端让部署变得简单。

12. Claude Haiku 4.5 — ~24B tokens Anthropic · $1/$5 · Hermes 的 smart routing 最爱用的 cheap_model 之一。SWE-bench 73%+，作为子 Agent 处理简单任务，配合 Opus/Sonnet 实现分层。

13. Qwen 3.6 Plus FREE — ~20B tokens 阿里云 · 混合线性注意力 + MoE · agentic coding 和前端开发显著增强。Hermes 支持 alibaba 直连 provider。

14. GPT-5 Nano — ~18B tokens OpenAI · $0.05/$0.40 · 400K 上下文 · 最小最快的 OpenAI 模型。在 Hermes 中常被用作意图分类器和路由器，通过 Copilot provider 使用时可免费访问。

15. Arcee Trinity Large Preview FREE — ~15B tokens Arcee AI · 400B MoE / 13B 激活 · 128K 上下文 · 专门训练了对 Agent 工具链（OpenCode、Cline、Kilo Code）的适配，创意写作和角色扮演能力突出。

Hermes Agent 排名背后的五大趋势

👑 Claude 在 Hermes 上统治力远超 OpenClaw

Sonnet + Opus + Haiku 三个 Claude 模型合计约 300B tokens，占 Hermes Agent 总量的近 30%。对比 OpenClaw 上 Claude 仅占约 10%。原因是 Hermes 的用户群体更技术化，对工具调用可靠性要求更高，愿意为质量付费。

🔗 直连 Provider 改变了模型格局

Hermes Agent 将智谱、Kimi、MiniMax、DeepSeek、阿里云等中国厂商都列为一级 provider，用户无需通过 OpenRouter 中转。这种「直连免佣金」的优势使得某些模型在 Hermes 上的排名与 OpenRouter 整体排名出现显著差异。

🧠 自学习特性影响模型选择

Hermes Agent 的核心卖点是「自进化」——自动创建技能、整理记忆、建立用户模型。这些功能高度依赖模型对结构化输出的精确控制，使得 Claude 和 GLM-5 Turbo 等工具调用最稳定的模型获得了比纯推理模型更高的份额。

⚡ Smart Routing 成为标配

Hermes 内置 smart_model_routing：短消息（<160 字符 / <28 词）自动路由到 cheap_model（如 Gemini Flash、Step 3.5 Flash），复杂任务走主模型。这解释了为什么免费模型和高价模型同时出现在排行榜上——它们在同一个用户的不同任务中各司其职。

🏠 Nous「自产自销」效应

Hermes 3 405B 在 OpenClaw 上未能进入 Top 20，但在 Hermes Agent 上位列第十——这就是生态亲和力的力量。Nous Research 同时掌握模型和 Agent 框架两端，能做到从 prompt 格式到技能系统的端到端优化，类似智谱 GLM-5 Turbo + AutoClaw 的策略。

💡 选型建议： 如果你刚开始使用 Hermes Agent，建议这样配置 smart routing：主模型用 Claude Sonnet 4.6（最可靠）或 GLM-5 Turbo（性价比最佳），cheap_model 设为 Gemini 2.5 Flash 或 Step 3.5 Flash（免费）。遇到超复杂任务时通过 /model 命令临时切换到 Opus 4.6 或 MiMo-V2-Pro。配置 fallback provider 为 DeepSeek，确保主 provider 宕机时自动切换。这种分层策略可以在保证质量的同时将月度 API 成本控制在 $10–25。

数据来源

本文排名基于 OpenRouter - Hermes Agent 应用页面公开数据及公开报道综合分析。由于 OpenRouter 页面的模型使用量详情通过 JavaScript 动态渲染，精确的逐模型 token 数字可能存在估算偏差。

Hermes Agent 模型使用量排名解读：Nous Research 如何搅动 AI Agent 格局？

什么是 Hermes Agent？