Hermes Agent 教程 6：多模型配置 — 灵活性的高级设置

教程概述

系列索引: Hermes Agent 教程系列

本文介绍 Hermes Agent 的多模型配置。这是一项高级能力，让你可以在 200+ 个 LLM 提供商与模型之间即时切换。

说明：之所以称它为“高级设置”，是因为它建立在你已经部署好 Hermes 的前提之上，无论你使用 CLI 还是消息网关。不是每个人都需要立刻配置它，但它对成本优化与能力灵活性非常关键。

你将学到什么

✅ 支持哪些提供商，以及它们各自的特点
✅ 提供商配置步骤
✅ 如何通过 hermes model 切换模型
✅ 成本优化策略
✅ 如何配置自定义端点

为什么模型灵活性重要

单一提供商的限制

大多数 AI 工具都把你锁定在单一提供商上：

Claude Code → 只能用 Anthropic
ChatGPT → 只能用 OpenAI
Gemini → 只能用 Google

带来的问题：

碰到速率限制？只能干等
成本突然升高？没有替代方案
某模型不可用？无法切换

Hermes 的多提供商方案

flowchart TD
    A[Hermes Agent] --> B[Nous Portal]
    A --> C[OpenRouter 200+]
    A --> D[z.ai/GLM]
    A --> E[Kimi/Moonshot]
    A --> F[MiniMax]
    A --> G[OpenAI]
    A --> H[自定义端点]

    style A fill:#e1f5ff

你可以即时切换：

/model openrouter:auto        # 自动选择最划算模型
/model anthropic:claude-4     # 复杂任务用高质量模型
/model openai:gpt-4o-mini     # 简单任务用更快更便宜的模型

支持的提供商

提供商对比

提供商	模型	免费额度	速率限制	适合场景
Nous Portal	Hermes 系列	有（受限）	中等	原生 Hermes
OpenRouter	200+ 模型	有	按模型区分	灵活选择
z.ai/GLM	GLM 系列	有	中等	中文用户
Kimi/Moonshot	Kimi 系列	有	中等	长上下文
MiniMax	MiniMax 系列	有	中等	多模态
OpenAI	GPT-4、GPT-4o	无	严格	企业环境
Anthropic	Claude 系列	无	中等	高质量输出

模型推荐

使用场景	推荐模型	提供商
快速查询	`openrouter:auto`	OpenRouter
复杂推理	`anthropic:claude-4`	Anthropic
代码生成	`openai:gpt-4o`	OpenAI
长文档处理	`moonshot:kimi`	Kimi
中文任务	`zai:glm-4`	z.ai
预算模式	`openrouter:claude-3-haiku`	OpenRouter

提供商配置

Nous Portal

Nous Research 的原生提供商：

hermes config set providers.nous.api_key "YOUR_NOUS_KEY"
hermes model nous:hermes-3

OpenRouter

通过一个 API 接入 200+ 个模型：

# 从 openrouter.ai 获取密钥
hermes config set providers.openrouter.api_key "YOUR_OPENROUTER_KEY"

# 使用自动选择
hermes model openrouter:auto

# 或指定具体模型
hermes model openrouter:anthropic/claude-3.5-sonnet

模型格式：provider/model-name

z.ai / GLM

中文 LLM 提供商：

hermes config set providers.zai.api_key "YOUR_ZAI_KEY"
hermes model zai:glm-4

Kimi / Moonshot

长上下文能力较强：

hermes config set providers.moonshot.api_key "YOUR_MOONSHOT_KEY"
hermes model moonshot:kimi

MiniMax

多模态能力较强：

hermes config set providers.minimax.api_key "YOUR_MINIMAX_KEY"
hermes model minimax:abab-6

OpenAI

hermes config set providers.openai.api_key "YOUR_OPENAI_KEY"
hermes model openai:gpt-4o

Anthropic

hermes config set providers.anthropic.api_key "YOUR_ANTHROPIC_KEY"
hermes model anthropic:claude-4

模型切换

交互式切换

sequenceDiagram
    participant U as 用户
    participant H as Hermes
    participant P as 提供商

    U->>H: /model openrouter:auto
    H->>P: 验证提供商
    P->>H: 可用
    H->>U: 已切换到 openrouter:auto

    U->>H: 发起请求
    H->>P: 发送给自动选择出的模型
    P->>H: 返回响应
    H->>U: 显示结果

    style H fill:#e1f5ff

在对话中切换

你: 这是一个复杂任务
Hermes: 我会使用 claude-4 处理复杂推理……

/model openai:gpt-4o-mini
Hermes: 已切换到 gpt-4o-mini

你: 现在问个简单问题
Hermes: 我将使用更便宜的 gpt-4o-mini

默认模型配置

# 设置默认模型
hermes config set model.default "openrouter:auto"

# 设置回退模型（默认模型失败时使用）
hermes config set model.fallback "openrouter:claude-3-haiku"

成本优化

策略 1：自动选择

openrouter:auto 会自动选出性价比最优的模型：

hermes model openrouter:auto

它会综合考虑：

当前请求的复杂度
可用模型额度
历史成功率

策略 2：分层路由

flowchart TD
    A[收到请求] --> B{复杂度?}
    B -->|简单| C[gpt-4o-mini: $0.15/1M]
    B -->|中等| D[claude-3-haiku: $0.25/1M]
    B -->|复杂| E[claude-4: $3/1M]

    style C fill:#e8f5e9
    style E fill:#fff3e0

配置分层路由：

routing:
  simple: openai:gpt-4o-mini
  medium: openrouter:claude-3-haiku
  complex: anthropic:claude-4
  thresholds:
    simple: 100  # tokens
    medium: 1000

策略 3：额度管理

# 设置每日限制
hermes config set quota.daily 100000  # tokens

# 设置单模型限制
hermes config set quota.models.claude-4 50000

成本追踪

/usage                          # 当前会话
/insights --days 7              # 最近一周拆分

输出示例：

Model               Tokens    Cost
────────────────────────────────────
openrouter:auto     15,420    $0.23
claude-3-haiku      8,200     $0.02
claude-4            3,100     $0.93
────────────────────────────────────
Total               26,720    $1.18

自定义端点配置

添加自定义端点

适用于自托管模型或企业内网模型：

hermes config set providers.custom.mycompany.url "https://api.mycompany.com/v1"
hermes config set providers.custom.mycompany.api_key "YOUR_KEY"
hermes model custom:mycompany:model-name

OpenAI 兼容端点

大多数自托管模型都支持 OpenAI 兼容格式：

providers:
  custom:
    local_llama:
      url: "http://localhost:8080/v1"
      api_key: "none"
      format: openai

切换命令：

/model custom:local_llama:llama-3

企业网关

适用于公司内部 API 网关：

providers:
  enterprise:
      url: "https://gateway.company.com/ai"
      api_key: "${ENTERPRISE_TOKEN}"
      headers:
        X-Department: engineering

常见问题排查

模型不可用

原因：提供商额度耗尽，或模型当前不可用。

解决方案：

hermes model --fallback    # 使用回退模型
hermes model openrouter:auto  # 交给自动选择处理

触发速率限制

原因：单一提供商请求过多。

解决方案：

# 切换提供商
hermes model openai:gpt-4o-mini

# 或启用分布式路由
hermes config set routing.distributed true

API key 无效

原因：密钥过期或填写错误。

解决方案：

hermes config set providers.PROVIDER.api_key "NEW_KEY"
hermes doctor --provider PROVIDER

总结

多模型配置是 Hermes 的灵活性优势：

200+ 模型 — 仅 OpenRouter 就提供大量选择
即时切换 — /model 命令可动态切换提供商
成本优化 — 自动选择、分层路由、额度管理
自定义端点 — 支持自托管和企业集成

关键要点

✅ OpenRouter 提供 200+ 模型访问能力
✅ /model provider:model 可即时切换
✅ openrouter:auto 可自动优化成本
✅ 分层路由有助于平衡成本与质量
✅ 自定义端点适合企业部署

系列导航:

毕业里程碑 G2：完成本文以及教程 4 到 5 后，你已经达到操作员级别。此时你的 Hermes Agent 已经完成部署，支持多模型，并可在消息平台或终端环境中运行。

教程概述

你将学到什么

为什么模型灵活性重要

单一提供商的限制

Hermes 的多提供商方案

支持的提供商

提供商对比

模型推荐

提供商配置

Nous Portal

OpenRouter

z.ai / GLM

Kimi / Moonshot

MiniMax

OpenAI

Anthropic

模型切换

交互式切换

在对话中切换

默认模型配置

成本优化

策略 1：自动选择

策略 2：分层路由

策略 3：额度管理

成本追踪

自定义端点配置

添加自定义端点

OpenAI 兼容端点

企业网关

常见问题排查

模型不可用

触发速率限制

API key 无效

总结

关键要点

🍪 Cookie 使用通知

Cookie 偏好设置

必要 Cookie

分析 Cookie

广告 Cookie