把 10.8GB vLLM 镜像的 Pod Ready 从 4m35s 降到 14s: Hermes + SOCI lazy loading 实测
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overla
MES - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第4页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 855 篇相关文章 · 第 4 / 43 页
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overla
Hermes agent 免费订阅不能登陆了吗? 提示:Your subscription and API credit balances are exhausted. Add credits before connecting Hermes Agent. 1 个帖子 - 1 位
昨天我的Hermes agent突发恶疾,发消息没有任何反应了。 然后用codex进nas中“深入研究”,得出结论是:我对接的飞书(实际上是lark,飞书的国际版)的api调用用完了,每个月才1w的额度… 刚玩第一个月,真的是毫无节制啊! 所以,想看看佬们都用的啥平台,或者是有没
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overla
ricky@archlinux ~> sudo dmesg | grep -i i2c [sudo] password for ricky: [ 0.211745] ACPI BIOS Error (bug): Could not resolve symbol [_SB.P
今早在接码的时候,发现有TextMessage可选,就简单看了network,发现选择Text Message的body会多个channel的参数,不知道大佬们能通过注册机强制使用TextMessage; 接口如下: fetch("https://auth.openai
我司主要是做 skills 的 只要给小龙虾、Hermes 这类 Agent 丢一段提示词,就能快速接上各种大模型、数据 API 和现成 Skill 。 比如 DataForSEO 、Twitter/X 、Apollo ,Agent 可以直接调用。 适合需要做自动化工作流、增长
MIMO服务器是不是挂了?hermes 突然连不上了 今天大家是不是蹬太猛了 ,很多今天到期的。。。。 1 个帖子 - 1 位参与者 阅读完整话题
大家用它来干啥现在 云端的话,还有点儿用处。 本地部署,感觉都用不上了 8 个帖子 - 7 位参与者 阅读完整话题
我司主要是做 skills 的 只要给小龙虾、Hermes 这类 Agent 丢一段提示词,就能快速接上各种大模型、数据 API 和现成 Skill 。 比如 DataForSEO 、Twitter/X 、Apollo ,Agent 可以直接调用。 适合需要做自动化工作流、增长
我司主要是做 skills 的 只要给小龙虾、Hermes 这类 Agent 丢一段提示词,就能快速接上各种大模型、数据 API 和现成 Skill 。 比如 DataForSEO 、Twitter/X 、Apollo ,Agent 可以直接调用。 适合需要做自动化工作流、增长
现在免费账号调用5.4报错是: {"error":{"message":"The 'gpt-5.4' model is not supported when using Codex with a ChatGPT
佬们,大家有用多agent进行端到端研发吗? 背景: 领导已经不满足我们使用codex、cc、cursor此类工具进行人机协同研发了,理想很美好:希望就是随时随地都能进行开发,然后下班前扔一个需求给他,明天过来它就开发好了。其次领导想要代码更可控,代码熵要做好管控,所以对每一个阶
最近想研究一下hermes,有没有佬玩的过的,可以交流一下心得和经验吗 1 个帖子 - 1 位参与者 阅读完整话题
auth error: 401, auth error code: token_revoked token refresh failed with status 401: { “error”: { “message”: “Your refresh token has been i
kanban这个功能应该怎么才能好用呢,想做一些复杂任务的情况下之前用langchain写的工作流,这个kanban能不能代替工作流。。。 1 个帖子 - 1 位参与者 阅读完整话题
最近在玩hermes智能体、 发现很多api-key的系统需要接入hermes,但是hermes 因为没有工具,不知道额度多少。 算是一个痛点吧?想要问下有类似的监控工具吗? 如果没有的话,我就去手搓一个了。、 1 个帖子 - 1 位参与者 阅读完整话题
最近一直在 Windows 上用 Codex、Claude Code、Hermes 这些 CLI agent,遇到一个很影响体验的小问题: 用微信或 QQ 的快捷键截图,点确认以后,回到终端里直接按 Ctrl+V ,经常没反应,或者 CLI agent 识别不到图片。可是如果我先
楼主,在深度使用了两天后发现,hermes并没有网上吹的那么牛,当然也有可能是我的姿势不对,整体体验不是很好,想知道各位佬,关于openclaw和hermes真实体验如何,有没有养 养 焚诀? 12 个帖子 - 10 位参与者 阅读完整话题
使用opencode就会显示推理强度,但是hermes就没有,hermes我已经设置为high了。 1 个帖子 - 1 位参与者 阅读完整话题