Hermes Agent 压缩模型问题

Hermes Agent的问题 我这两天使用Hermes中,遇到的问题: Compression summary failed: Error code: 502 {'error': {'message': 'Upstream stream ended without a terminal respo...
Hermes Agent 压缩模型问题
Hermes Agent 压缩模型问题

Hermes Agent的问题

我这两天使用Hermes中,遇到的问题:

Compression summary failed: Error code: 502
{'error': {'message': 'Upstream stream ended without a terminal response event'}}
Inserted a fallback context marker.

该错误会循环出现,原因是框架在压缩失败后插入占位符继续运行,下次 context 超长时再次触发压缩,形成死循环。

目前是开启一个新的会话来解决,不然一直触发压缩失败!!!

大家是怎么处理的啊?这块儿有点迷茫~~~

接下来就让AI一直再给我分析

错误的触发逻辑如下:
  • Agent 对话持续进行,context 逐渐变长
  • context 超过阈值,框架自动触发「压缩摘要」任务
  • 压缩任务调用 Hermes 模型执行摘要,Hermes 返回 502 错误
  • 框架捕获错误,插入 fallback context marker 后继续运行
  • context 再次累积超长,再次触发压缩 → 再次 502,循环不止

就很奇怪,很纳闷,难道是得单独配置压缩模型吗?

还是说Nginx 超时配置呢?这个我配置了300s不够吗?
还是说流式输出未关闭缓冲?
还是Hermes VRAM 不足?等等吧

最后咋处理的呢

新开一个会话!!!!

加一个压缩模型试试
compression:
    provider: anthropic
    model: claude-sonnet-4.6
    base_url: 'https://api.anthropic.com'
    api_key: 'sk-ant-你的API密钥'
    timeout: 300
    extra_body: {}
Nginx 生产配置
location / {
    proxy_pass http://your_llm_backend;

    # 超时时间(默认 60s 对 LLM 不够)
    proxy_read_timeout    300s;
    proxy_send_timeout    300s;
    proxy_connect_timeout  60s;

    # 流式响应必须关闭缓冲
    proxy_buffering off;
    proxy_cache    off;

    # SSE / Streaming 支持
    proxy_set_header Connection '';
    chunked_transfer_encoding on;
}

佬们,遇到过吗?咋解决的啊?我的服务器是2c4g的~~~~~

3 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文