[分享创造] openEagle - 用视觉感知操作电脑的开源桌面 AI Agent, MVP 跑通了
目前像是 OpenClaw 、hermes 其实感觉操作/辅助的能力是有限的,基本上能力都是基于 cli 或命令行的,还不足以达到类人的级别(轻度使用,有错欢迎指正) 所以我做了一个 AI Agent 客户端,通过截图 + 视觉理解模型来分析屏幕内容,然后控制鼠标键盘完成任务(就
感知 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 14 篇相关文章
目前像是 OpenClaw 、hermes 其实感觉操作/辅助的能力是有限的,基本上能力都是基于 cli 或命令行的,还不足以达到类人的级别(轻度使用,有错欢迎指正) 所以我做了一个 AI Agent 客户端,通过截图 + 视觉理解模型来分析屏幕内容,然后控制鼠标键盘完成任务(就
我们是 MachinePulse 团队,今天我们正式推出 World2Agents Protocol (下文简称 W2A ),一个开放的、AI 原生的信号感知协议。 今天大部分 Agent 都是被动响应的,因为它们"看不到"世界正在发生什么。W2A 就是给 A
据Windows Latest报道, 微软正在对Windows 11内置的时钟App进行大幅改版,增强的专注模式将引入AI驱动的洞察功能,并利用PC端NPU实现注意力状态检测。 新版时钟App采用了大量圆角设计和更简洁的UI风格,与长期未更新的旧版形成明显差异。 专注模式支持自定
想问问有没有做智能操作解决方案的公司呢
IT之家 4 月 22 日消息,在第十六届中国国际道路交通安全产品博览会上,京东物流正式推出“独狼”第六代智能配送车 Plus 版,该车为 L4 级自动驾驶无人配送车型,主要在货箱容积和智能化方面进行升级。 据介绍,新款无人车货箱容积从 4 立方米扩大至 5.5 立方米,最大载重
目前在搞深度学习的多任务感知,实验做的差不多了,然后上手写发现一个字也蹦不出来 求助各位佬有没有好的写论文的方法,思路和好用的工程或者skills啥的。在这里先谢谢各位佬了 5 个帖子 - 4 位参与者 阅读完整话题
当前订阅是GPT-Plus,明显感知不够用。打算买个国模备用了。 佬友们讨论下,买不到的就不说了,kimi和minimax更推荐哪个呢 1k一年的那个套餐,每天都大概可以用多久呢? 17 个帖子 - 11 位参与者 阅读完整话题
我几乎不怎么喜欢用国外模型,因为在我的使用体验中,我感知里,国内国个并没有我想像的那么大,而且国外的没有稳定的提供平台。 所以我打自大模型流行以来,一直主打使用国产模型。 之前是半手打半ai,用了glm5之后,彻底一行代码都不写了。 也就是今年以来,我没有手写过一行新代码。 我也
跟大家分享下最近几天最新的研究成果,我们把Spice和Hermes做了一个组合,给Hermes注入了Spice的感知能力,state model,决策能力及决策演化,Hermes的agent能力自进化和Spice的决策能力自进化能让他们的组合完美发挥各自的优势。 经过这次的实验我
IT之家 4 月 16 日消息,长安深蓝汽车今日继续预热全新深蓝 S07 华为乾崑激光版汽车。目前,新车已首发亮相,并公布了外观。 IT之家从深蓝汽车获悉, 深蓝 S07 华为乾崑激光版全车搭载 27 个传感器融合感知系统 ,支持全新 WEWA 架构的华为乾崑 ADS 4.1 辅
IT之家 4 月 16 日消息,谷歌昨日(4 月 15 日)推出 Mac 原生版 Gemini 应用,采用 100% Swift 开发,支持 Option + Space 快捷键唤起、屏幕共享及多语音播报。应用要求 macOS 15 Sequoia 及以上系统,Mac 用户即日起
IT之家 4 月 13 日消息,据央视新闻今日报道,山西省地震局在恒山悬空寺部署“ 结构健康监测与振(震)动风险感知系统 ”,以科技赋能守护千年古建安全。 图源:Pexels 悬空寺依崖而建、以木为骨,抗震保护任务艰巨。结构健康监测工作严格恪守“不改变文物原状”原则, 在关键梁柱
IT之家 4 月 12 日消息,自动雨刮是特斯拉最受诟病的功能之一,但特斯拉一名高管证实,该功能近期迎来重大升级,旗下所有车型都将受益。 特斯拉已悄悄向全车队推送重磅 OTA 更新,应用了一项全新专利,有望彻底解决其车型中最受用户诟病的功能之一:自动雨刮。 特斯拉 AI 高级工程
4月23日,华为乾崑发布了全新一代鸿蒙座舱HarmonySpace 6,升级了舱内感知、智能交互和影音体验。舱内感知层面,首发行业唯一的舱内AI多模态感知系统AMS;智能交互层面,基于全新MoLA 2.0架构,发布新一代鸿蒙座舱小艺智能体,打通导航、控车、聊天、生活服务等各类场景