[分享创造] openEagle - 用视觉感知操作电脑的开源桌面 AI Agent, MVP 跑通了
目前像是 OpenClaw 、hermes 其实感觉操作/辅助的能力是有限的,基本上能力都是基于 cli 或命令行的,还不足以达到类人的级别(轻度使用,有错欢迎指正) 所以我做了一个 AI Agent 客户端,通过截图 + 视觉理解模型来分析屏幕内容,然后控制鼠标键盘完成任务(就
NC - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第8页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 862 篇相关文章 · 第 8 / 44 页
目前像是 OpenClaw 、hermes 其实感觉操作/辅助的能力是有限的,基本上能力都是基于 cli 或命令行的,还不足以达到类人的级别(轻度使用,有错欢迎指正) 所以我做了一个 AI Agent 客户端,通过截图 + 视觉理解模型来分析屏幕内容,然后控制鼠标键盘完成任务(就
现在是 ai 业务发展初期,我见到的多数都是智能客服,智能审核类的,这种做 openclaw 是啥业务?有没有大佬解释下?还有没有啥其他 ai 业务能实际落地的?
做个可以自由旋转的魔方的前端页面历经5轮对话,功能才能勉强实现。 第6轮对话让他模型更精致点,结果就功能失常,还在检修中 win 版 opencode ============================================= 思考5分钟,问题没有解决,有的难受。
请问佬友们,有用trae国际版的吗?自定义模型接入deepseek-v4为什么很慢呢? 我用opencode使用deepseek-v4的速度就很正常 1 个帖子 - 1 位参与者 阅读完整话题
重试可解,大不了多几次,在别的地方找到是说渠道混用: codex status_code=400, The encrypted content QVhO...og== could not be verified. Reason: Encrypted content could n
这个 400 不是普通模型失败,也不是模板组装失败。它基本是 Responses API 的 reasoning.encrypted_content 无法被当 前上游解密/校验。 OpenAI 的 Responses API 支持 reasoning.encrypted_cont
如题,之前用opencode+OMO+GPT5.4,工作流很习惯了。现在切到GPT5.5,虽然感觉能力确实明显有提升,但是经常出现几个task/tools的结果一下子塞爆上下文连compact都做不到的情况。 codex上因为有会话内自动压缩,基本不需要手动压缩,更加适配GPT
我目前打算用 edgeone pages 、edgeone functions 和 supabase 。 我计划做的网站后端不多,基本全是前端。后端主要就是注册和收集一些用户数据。数据主要是行为数据,不是隐私数据,数据主要是用来优化网站的。用这个方案会不会有什么坑?有更好的方案吗
我目前打算用 edgeone pages 、edgeone functions 和 supabase 。 我计划做的网站后端不多,基本全是前端。后端主要就是注册和收集一些用户数据。数据主要是行为数据,不是隐私数据,数据主要是用来优化网站的。用这个方案会不会有什么坑?有更好的方案吗
官方声称免费AI对话额度 10分钟免费时长 实测截图 由于限免时间有限,只能探索到这了 1 个帖子 - 1 位参与者 阅读完整话题
今天装了个hermes,连接微信扫码后发现跟以前用openclaw和halowebui的时候不太一样,以前就确认下就好,今天弹出个输入数字,但似乎hermes没地方输入数字。 1 个帖子 - 1 位参与者 阅读完整话题
congig的配置文件 一定要加上wire_api = “responses” ,而go的端点是 https://opencode.ai/zen/go/v1/chat/completions,,,,completions的,,然后我再cc switch怎么配置都不行,实现没办法了
在一个大型仓库中 使用 opencode 对 pro 以及 flash 分别让其根据代码库分析三个问题。pro 回答更好,更符合人的预期。flash 稍差一些,但是基本也能够分析到,只是结论总结的不如 pro,但是速度更快。 本次测试主要关注的价格: 价格方面 6 轮问答 多次检
受够 Codex 了又慢又卡,要不是图他便宜 怎么能在 Claude Code 或者 OpenCode 上面用啊 9 个帖子 - 7 位参与者 阅读完整话题
同一个模型下,claude code、opencode、cursor、windsurf、kilocode等等这些代码agent外壳谁做的更好呢? 10 个帖子 - 8 位参与者 阅读完整话题
现在那个视频生成API聚合平台好用啊,用Seedance2.0和Kling 3.0,POE怎么样,求推荐靠谱平台 有大佬用过POE的API吗,速度和质量怎么样,有啥别的可以推荐一下吗?最好是官网,希望速度快并发高 这Seedance 2.0 的467 points/ 1k vid
暂时不考虑各种插件和 skill,只考虑开箱即用 glm 5.1 搭配这两个 agent,谁的效果更好? 有没有熟悉的佬友出来说说 9 个帖子 - 7 位参与者 阅读完整话题
WSL 与 Windows 双环境 OpenCode 配置同步实践 背景 在 WSL 和 Windows 双环境下使用 OpenCode 时,希望两边配置和会话数据能够同步,避免手动切换环境时丢失上下文。 主要分为两块:配置目录同步和会话数据库同步。把步骤直接丢给agent应该就
目前我用的字节的coding plan,虽然额度消耗非常夸张,但kimi支持图片理解,不过我才几天就要把额度给蹬完了。 现在想转向go,仔细翻阅了官网介绍,压根就没提图片理解的事,有没有佬验证过kimi-2.6啊 4 个帖子 - 3 位参与者 阅读完整话题
https://www.stheadline.com/realtime-finance/3567043 在公司摸鱼蒸馏模型卖给国内公司是吧。 A/的想像力无敌了。 真这么怕被蒸馏就别拿出来卖了,这样就没人能蒸馏了 7 个帖子 - 7 位参与者 阅读完整话题