返回

Hermes Agent 教程 6:多模型配置 — 灵活性的高级设置

为 Hermes Agent 配置多个 LLM 提供商,包括 Nous Portal、OpenRouter、z.ai、Kimi、MiniMax、OpenAI。本文介绍模型切换、成本优化和自定义端点配置。

教程概述

系列索引: Hermes Agent 教程系列

本文介绍 Hermes Agent 的多模型配置。这是一项高级能力,让你可以在 200+ 个 LLM 提供商与模型之间即时切换。

说明:之所以称它为“高级设置”,是因为它建立在你已经部署好 Hermes 的前提之上,无论你使用 CLI 还是消息网关。不是每个人都需要立刻配置它,但它对成本优化与能力灵活性非常关键。

你将学到什么

  • ✅ 支持哪些提供商,以及它们各自的特点
  • ✅ 提供商配置步骤
  • ✅ 如何通过 hermes model 切换模型
  • ✅ 成本优化策略
  • ✅ 如何配置自定义端点

为什么模型灵活性重要

单一提供商的限制

大多数 AI 工具都把你锁定在单一提供商上:

  • Claude Code → 只能用 Anthropic
  • ChatGPT → 只能用 OpenAI
  • Gemini → 只能用 Google

带来的问题:

  • 碰到速率限制?只能干等
  • 成本突然升高?没有替代方案
  • 某模型不可用?无法切换

Hermes 的多提供商方案

flowchart TD
    A[Hermes Agent] --> B[Nous Portal]
    A --> C[OpenRouter 200+]
    A --> D[z.ai/GLM]
    A --> E[Kimi/Moonshot]
    A --> F[MiniMax]
    A --> G[OpenAI]
    A --> H[自定义端点]

    style A fill:#e1f5ff

你可以即时切换:

/model openrouter:auto        # 自动选择最划算模型
/model anthropic:claude-4     # 复杂任务用高质量模型
/model openai:gpt-4o-mini     # 简单任务用更快更便宜的模型

支持的提供商

提供商对比

提供商 模型 免费额度 速率限制 适合场景
Nous Portal Hermes 系列 有(受限) 中等 原生 Hermes
OpenRouter 200+ 模型 按模型区分 灵活选择
z.ai/GLM GLM 系列 中等 中文用户
Kimi/Moonshot Kimi 系列 中等 长上下文
MiniMax MiniMax 系列 中等 多模态
OpenAI GPT-4、GPT-4o 严格 企业环境
Anthropic Claude 系列 中等 高质量输出

模型推荐

使用场景 推荐模型 提供商
快速查询 openrouter:auto OpenRouter
复杂推理 anthropic:claude-4 Anthropic
代码生成 openai:gpt-4o OpenAI
长文档处理 moonshot:kimi Kimi
中文任务 zai:glm-4 z.ai
预算模式 openrouter:claude-3-haiku OpenRouter

提供商配置

Nous Portal

Nous Research 的原生提供商:

hermes config set providers.nous.api_key "YOUR_NOUS_KEY"
hermes model nous:hermes-3

OpenRouter

通过一个 API 接入 200+ 个模型:

# 从 openrouter.ai 获取密钥
hermes config set providers.openrouter.api_key "YOUR_OPENROUTER_KEY"

# 使用自动选择
hermes model openrouter:auto

# 或指定具体模型
hermes model openrouter:anthropic/claude-3.5-sonnet

模型格式provider/model-name

z.ai / GLM

中文 LLM 提供商:

hermes config set providers.zai.api_key "YOUR_ZAI_KEY"
hermes model zai:glm-4

Kimi / Moonshot

长上下文能力较强:

hermes config set providers.moonshot.api_key "YOUR_MOONSHOT_KEY"
hermes model moonshot:kimi

MiniMax

多模态能力较强:

hermes config set providers.minimax.api_key "YOUR_MINIMAX_KEY"
hermes model minimax:abab-6

OpenAI

hermes config set providers.openai.api_key "YOUR_OPENAI_KEY"
hermes model openai:gpt-4o

Anthropic

hermes config set providers.anthropic.api_key "YOUR_ANTHROPIC_KEY"
hermes model anthropic:claude-4

模型切换

交互式切换

sequenceDiagram
    participant U as 用户
    participant H as Hermes
    participant P as 提供商

    U->>H: /model openrouter:auto
    H->>P: 验证提供商
    P->>H: 可用
    H->>U: 已切换到 openrouter:auto

    U->>H: 发起请求
    H->>P: 发送给自动选择出的模型
    P->>H: 返回响应
    H->>U: 显示结果

    style H fill:#e1f5ff

在对话中切换

你: 这是一个复杂任务
Hermes: 我会使用 claude-4 处理复杂推理……

/model openai:gpt-4o-mini
Hermes: 已切换到 gpt-4o-mini

你: 现在问个简单问题
Hermes: 我将使用更便宜的 gpt-4o-mini

默认模型配置

# 设置默认模型
hermes config set model.default "openrouter:auto"

# 设置回退模型(默认模型失败时使用)
hermes config set model.fallback "openrouter:claude-3-haiku"

成本优化

策略 1:自动选择

openrouter:auto 会自动选出性价比最优的模型:

hermes model openrouter:auto

它会综合考虑:

  • 当前请求的复杂度
  • 可用模型额度
  • 历史成功率

策略 2:分层路由

flowchart TD
    A[收到请求] --> B{复杂度?}
    B -->|简单| C[gpt-4o-mini: $0.15/1M]
    B -->|中等| D[claude-3-haiku: $0.25/1M]
    B -->|复杂| E[claude-4: $3/1M]

    style C fill:#e8f5e9
    style E fill:#fff3e0

配置分层路由:

routing:
  simple: openai:gpt-4o-mini
  medium: openrouter:claude-3-haiku
  complex: anthropic:claude-4
  thresholds:
    simple: 100  # tokens
    medium: 1000

策略 3:额度管理

# 设置每日限制
hermes config set quota.daily 100000  # tokens

# 设置单模型限制
hermes config set quota.models.claude-4 50000

成本追踪

/usage                          # 当前会话
/insights --days 7              # 最近一周拆分

输出示例:

Model               Tokens    Cost
────────────────────────────────────
openrouter:auto     15,420    $0.23
claude-3-haiku      8,200     $0.02
claude-4            3,100     $0.93
────────────────────────────────────
Total               26,720    $1.18

自定义端点配置

添加自定义端点

适用于自托管模型或企业内网模型:

hermes config set providers.custom.mycompany.url "https://api.mycompany.com/v1"
hermes config set providers.custom.mycompany.api_key "YOUR_KEY"
hermes model custom:mycompany:model-name

OpenAI 兼容端点

大多数自托管模型都支持 OpenAI 兼容格式:

providers:
  custom:
    local_llama:
      url: "http://localhost:8080/v1"
      api_key: "none"
      format: openai

切换命令:

/model custom:local_llama:llama-3

企业网关

适用于公司内部 API 网关:

providers:
  enterprise:
      url: "https://gateway.company.com/ai"
      api_key: "${ENTERPRISE_TOKEN}"
      headers:
        X-Department: engineering

常见问题排查

模型不可用

原因:提供商额度耗尽,或模型当前不可用。

解决方案

hermes model --fallback    # 使用回退模型
hermes model openrouter:auto  # 交给自动选择处理

触发速率限制

原因:单一提供商请求过多。

解决方案

# 切换提供商
hermes model openai:gpt-4o-mini

# 或启用分布式路由
hermes config set routing.distributed true

API key 无效

原因:密钥过期或填写错误。

解决方案

hermes config set providers.PROVIDER.api_key "NEW_KEY"
hermes doctor --provider PROVIDER

总结

多模型配置是 Hermes 的灵活性优势

  1. 200+ 模型 — 仅 OpenRouter 就提供大量选择
  2. 即时切换/model 命令可动态切换提供商
  3. 成本优化 — 自动选择、分层路由、额度管理
  4. 自定义端点 — 支持自托管和企业集成

关键要点

  • ✅ OpenRouter 提供 200+ 模型访问能力
  • /model provider:model 可即时切换
  • openrouter:auto 可自动优化成本
  • ✅ 分层路由有助于平衡成本与质量
  • ✅ 自定义端点适合企业部署

系列导航:


毕业里程碑 G2:完成本文以及教程 4 到 5 后,你已经达到操作员级别。此时你的 Hermes Agent 已经完成部署,支持多模型,并可在消息平台或终端环境中运行。