Hermes 接 Kimi

月之暗面 Kimi(Moonshot)是国产长上下文(128K - 200K)的代表选手。

适合场景

✅ 长文档处理 / 整本书分析(128K 起步,可上 200K) ✅ 中文写作 / 文章润色(中文能力 top 梯队) ✅ DeepSeek + Qwen 之外的第三选项

❌ 函数调用密集 / 复杂工具链(Kimi function calling 不如 DeepSeek 稳) ❌ 价格敏感(普通模型比 DeepSeek 贵 2-5 倍)

bash

# ~/.u-hermes/data/.env
MOONSHOT_API_KEY=sk-你的key
HERMES_DEFAULT_MODEL=moonshot-v1-auto
NO_PROXY=127.0.0.1,localhost,::1

Web UI 问:"今天上下文有多大?"

应该回类似:"我支持 128K(约 10 万字符)的上下文。"

和 DeepSeek 一样支持 prompt cache,不过用法不同。Hermes 默认不开,手动启用:

bash

HERMES_KIMI_CACHE=1
HERMES_KIMI_CACHE_TTL=3600  # 缓存 1 小时

推荐组合:DeepSeek 主用 + Kimi 备用(长文档时)。

Q: 报 ContextWindowExceeded 切换 moonshot-v1-auto 让 Kimi 自动选合适大小,或显式 moonshot-v1-128k。

Q: 速度比 DeepSeek 慢一倍? Kimi 在国内中午高峰会拥堵。错峰用,或退回 DeepSeek。