教程概述
系列索引: Hermes Agent 教程系列
本文介绍 Hermes Agent 的多模型配置。这是一项高级能力,让你可以在 200+ 个 LLM 提供商与模型之间即时切换。
说明:之所以称它为“高级设置”,是因为它建立在你已经部署好 Hermes 的前提之上,无论你使用 CLI 还是消息网关。不是每个人都需要立刻配置它,但它对成本优化与能力灵活性非常关键。
你将学到什么
- ✅ 支持哪些提供商,以及它们各自的特点
- ✅ 提供商配置步骤
- ✅ 如何通过
hermes model切换模型 - ✅ 成本优化策略
- ✅ 如何配置自定义端点
为什么模型灵活性重要
单一提供商的限制
大多数 AI 工具都把你锁定在单一提供商上:
- Claude Code → 只能用 Anthropic
- ChatGPT → 只能用 OpenAI
- Gemini → 只能用 Google
带来的问题:
- 碰到速率限制?只能干等
- 成本突然升高?没有替代方案
- 某模型不可用?无法切换
Hermes 的多提供商方案
flowchart TD
A[Hermes Agent] --> B[Nous Portal]
A --> C[OpenRouter 200+]
A --> D[z.ai/GLM]
A --> E[Kimi/Moonshot]
A --> F[MiniMax]
A --> G[OpenAI]
A --> H[自定义端点]
style A fill:#e1f5ff
你可以即时切换:
/model openrouter:auto # 自动选择最划算模型
/model anthropic:claude-4 # 复杂任务用高质量模型
/model openai:gpt-4o-mini # 简单任务用更快更便宜的模型
支持的提供商
提供商对比
| 提供商 | 模型 | 免费额度 | 速率限制 | 适合场景 |
|---|---|---|---|---|
| Nous Portal | Hermes 系列 | 有(受限) | 中等 | 原生 Hermes |
| OpenRouter | 200+ 模型 | 有 | 按模型区分 | 灵活选择 |
| z.ai/GLM | GLM 系列 | 有 | 中等 | 中文用户 |
| Kimi/Moonshot | Kimi 系列 | 有 | 中等 | 长上下文 |
| MiniMax | MiniMax 系列 | 有 | 中等 | 多模态 |
| OpenAI | GPT-4、GPT-4o | 无 | 严格 | 企业环境 |
| Anthropic | Claude 系列 | 无 | 中等 | 高质量输出 |
模型推荐
| 使用场景 | 推荐模型 | 提供商 |
|---|---|---|
| 快速查询 | openrouter:auto |
OpenRouter |
| 复杂推理 | anthropic:claude-4 |
Anthropic |
| 代码生成 | openai:gpt-4o |
OpenAI |
| 长文档处理 | moonshot:kimi |
Kimi |
| 中文任务 | zai:glm-4 |
z.ai |
| 预算模式 | openrouter:claude-3-haiku |
OpenRouter |
提供商配置
Nous Portal
Nous Research 的原生提供商:
hermes config set providers.nous.api_key "YOUR_NOUS_KEY"
hermes model nous:hermes-3
OpenRouter
通过一个 API 接入 200+ 个模型:
# 从 openrouter.ai 获取密钥
hermes config set providers.openrouter.api_key "YOUR_OPENROUTER_KEY"
# 使用自动选择
hermes model openrouter:auto
# 或指定具体模型
hermes model openrouter:anthropic/claude-3.5-sonnet
模型格式:provider/model-name
z.ai / GLM
中文 LLM 提供商:
hermes config set providers.zai.api_key "YOUR_ZAI_KEY"
hermes model zai:glm-4
Kimi / Moonshot
长上下文能力较强:
hermes config set providers.moonshot.api_key "YOUR_MOONSHOT_KEY"
hermes model moonshot:kimi
MiniMax
多模态能力较强:
hermes config set providers.minimax.api_key "YOUR_MINIMAX_KEY"
hermes model minimax:abab-6
OpenAI
hermes config set providers.openai.api_key "YOUR_OPENAI_KEY"
hermes model openai:gpt-4o
Anthropic
hermes config set providers.anthropic.api_key "YOUR_ANTHROPIC_KEY"
hermes model anthropic:claude-4
模型切换
交互式切换
sequenceDiagram
participant U as 用户
participant H as Hermes
participant P as 提供商
U->>H: /model openrouter:auto
H->>P: 验证提供商
P->>H: 可用
H->>U: 已切换到 openrouter:auto
U->>H: 发起请求
H->>P: 发送给自动选择出的模型
P->>H: 返回响应
H->>U: 显示结果
style H fill:#e1f5ff
在对话中切换
你: 这是一个复杂任务
Hermes: 我会使用 claude-4 处理复杂推理……
/model openai:gpt-4o-mini
Hermes: 已切换到 gpt-4o-mini
你: 现在问个简单问题
Hermes: 我将使用更便宜的 gpt-4o-mini
默认模型配置
# 设置默认模型
hermes config set model.default "openrouter:auto"
# 设置回退模型(默认模型失败时使用)
hermes config set model.fallback "openrouter:claude-3-haiku"
成本优化
策略 1:自动选择
openrouter:auto 会自动选出性价比最优的模型:
hermes model openrouter:auto
它会综合考虑:
- 当前请求的复杂度
- 可用模型额度
- 历史成功率
策略 2:分层路由
flowchart TD
A[收到请求] --> B{复杂度?}
B -->|简单| C[gpt-4o-mini: $0.15/1M]
B -->|中等| D[claude-3-haiku: $0.25/1M]
B -->|复杂| E[claude-4: $3/1M]
style C fill:#e8f5e9
style E fill:#fff3e0
配置分层路由:
routing:
simple: openai:gpt-4o-mini
medium: openrouter:claude-3-haiku
complex: anthropic:claude-4
thresholds:
simple: 100 # tokens
medium: 1000
策略 3:额度管理
# 设置每日限制
hermes config set quota.daily 100000 # tokens
# 设置单模型限制
hermes config set quota.models.claude-4 50000
成本追踪
/usage # 当前会话
/insights --days 7 # 最近一周拆分
输出示例:
Model Tokens Cost
────────────────────────────────────
openrouter:auto 15,420 $0.23
claude-3-haiku 8,200 $0.02
claude-4 3,100 $0.93
────────────────────────────────────
Total 26,720 $1.18
自定义端点配置
添加自定义端点
适用于自托管模型或企业内网模型:
hermes config set providers.custom.mycompany.url "https://api.mycompany.com/v1"
hermes config set providers.custom.mycompany.api_key "YOUR_KEY"
hermes model custom:mycompany:model-name
OpenAI 兼容端点
大多数自托管模型都支持 OpenAI 兼容格式:
providers:
custom:
local_llama:
url: "http://localhost:8080/v1"
api_key: "none"
format: openai
切换命令:
/model custom:local_llama:llama-3
企业网关
适用于公司内部 API 网关:
providers:
enterprise:
url: "https://gateway.company.com/ai"
api_key: "${ENTERPRISE_TOKEN}"
headers:
X-Department: engineering
常见问题排查
模型不可用
原因:提供商额度耗尽,或模型当前不可用。
解决方案:
hermes model --fallback # 使用回退模型
hermes model openrouter:auto # 交给自动选择处理
触发速率限制
原因:单一提供商请求过多。
解决方案:
# 切换提供商
hermes model openai:gpt-4o-mini
# 或启用分布式路由
hermes config set routing.distributed true
API key 无效
原因:密钥过期或填写错误。
解决方案:
hermes config set providers.PROVIDER.api_key "NEW_KEY"
hermes doctor --provider PROVIDER
总结
多模型配置是 Hermes 的灵活性优势:
- 200+ 模型 — 仅 OpenRouter 就提供大量选择
- 即时切换 —
/model命令可动态切换提供商 - 成本优化 — 自动选择、分层路由、额度管理
- 自定义端点 — 支持自托管和企业集成
关键要点
- ✅ OpenRouter 提供 200+ 模型访问能力
- ✅
/model provider:model可即时切换 - ✅
openrouter:auto可自动优化成本 - ✅ 分层路由有助于平衡成本与质量
- ✅ 自定义端点适合企业部署
系列导航:
- ← 上一篇: 教程 5:CLI 与 TUI — 终端界面
- → 下一篇: 教程 7:终端后端 — 本地与云端部署
- 返回: 系列索引
毕业里程碑 G2:完成本文以及教程 4 到 5 后,你已经达到操作员级别。此时你的 Hermes Agent 已经完成部署,支持多模型,并可在消息平台或终端环境中运行。