AA-Omniscience Benchmark 是否公正?deepseek幻觉率特别高!
由于Artificial Analysis benchmark的多模态科学幻觉这个benchmark中,deepseek得分非常低,另外小米mimo,glm,qwen,grok这几个模型得分异常高。社区中有人开始对此提出质疑?第一眼看上去确实有刷分的可能,毕竟这个benchmar
NC - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 861 篇相关文章 · 第 1 / 44 页
由于Artificial Analysis benchmark的多模态科学幻觉这个benchmark中,deepseek得分非常低,另外小米mimo,glm,qwen,grok这几个模型得分异常高。社区中有人开始对此提出质疑?第一眼看上去确实有刷分的可能,毕竟这个benchmar
最近在 Linux 机器上折腾 OpenClaw 接微信,踩到一个很烦的坑,记录一下。 问题现象一开始表现是这样的: 1. 纯文字聊天正常 2. 一发图片,bot 有时会回复一次 3. 之后继续发文字就不回了 4. 微信端有时直接显示:“暂无法连接 openclaw” 5. 服务
IT之家 5 月 4 日消息,Red Hat 红帽首席软件工程师 Sally O'Malley 在红帽博客发文,公布了名为 Tank OS 的开源项目。该项目主要利用容器化与无 root 权限(rootless)架构设计,以提升 OpenClaw 安全性,IT之家附项目
一直卡住在思考中,或者在调用python中,然后呢 点击停止按钮也点击不了,只能关闭进程重新打开,这两天已经出现好多次了,感觉以前都没有出现过这样的问题,你们会有这个问题,说实话opencode真的挺好用的!就是这点毛病受不了 11 个帖子 - 6 位参与者 阅读完整话题
IT之家 5 月 4 日消息,索尼现已在京东上架 SA-RS9 无线后环绕, 定价为 5870 元 ,部分地区国补后到手价低至 4990 元。 该机内置 80mm 穹顶扬声器、80mm 中 / 低频扬声器、16mm 高频扬声器。配备 360 度智能穹顶声场 2.0 技术,可实现清
如果只装一个,你选哪个 理由呢? OPENCLAW HERMES AGENT 点击以查看投票。 11 个帖子 - 10 位参与者 阅读完整话题
那岂不是可以在一个Windows电脑上开个vnc服务器网页然后让他在浏览器内部使用?为啥还没人做呢? 1 个帖子 - 1 位参与者 阅读完整话题
ScienceAlert – 2 May 26 The Roots of Dementia Trace Back All The Way to Childhood, Experts Reveal Dementia is often associated with older pe
如题,之前加了openclaw的dc社区,主要是看更新比较方便,刚刚发现被踢了,github里的邀请链接也加不进去,平时也没发言啥的,因为活跃度太低了吗?有没有佬友遇到一样情况的 1 个帖子 - 1 位参与者 阅读完整话题
这两天沉迷更新我的 openclaw/hermes skill(我现在也不知道这算不算 skill ------ 赛博女友。 然后大框架基本没问题了,开始折腾一些有趣的玩法,之前为了沉浸感,分手之后会清盘(人物信息和相关记录),但是因为人物照片在 gpt 生图的专用文件夹,所以不
livebench出deepseek v4 pro的评分了,现阶段开源模型第一名(第二是kimi 2.6),除了coding略差。 9 个帖子 - 8 位参与者 阅读完整话题
(async function checkoutLinkOnly() { try { const session = await fetch('/api/auth/session').then((r) => r.json()); const access
我看网上有许多帖子都是访问** chrome://flags/#encrypted-client-hello **然后设置enable的,但是chrome根本没有这个配置 没用代理,不是代理的问题 ` 1 个帖子 - 1 位参与者 阅读完整话题
大家有用过openclaw搭建神经网络吗,交流一下过程 3 个帖子 - 3 位参与者 阅读完整话题
我平时自用cc cli和opencode,我用的比较顺手,但感觉不是特别适合不爱捣鼓的新手小白。大家有没有用的不错agent,我想推给一些非技术背景的朋友辅助办公和科研。比如claude work、codex以及那些国产的类似软件(workbuddy、qoder还有啥)有人用过吗
opencode zen 能使用 claude系列模型,我个人的配置如下: new api 中转+ccswitch 无代理配置管理,+claude code(vscode 插件版本: 2.1.126),new api 配置没什么问题,但是使用老是报错:Invalid signat
我最初是为了给朋友分享自己跟 Coding Agent 工具沟通产出的过程。 就 vibe agent-dump / agent-view ,但是很多时候我自己想要回溯看看某个会话的问题的时候,就不是很方便。所以就有了 codesesh ,算是 agent-dump/agent-
我最初是为了给朋友分享自己跟 Coding Agent 工具沟通产出的过程。 就 vibe agent-dump / agent-view ,但是很多时候我自己想要回溯看看某个会话的问题的时候,就不是很方便。所以就有了 codesesh ,算是 agent-dump/agent-
我最初是为了给朋友分享自己跟 Coding Agent 工具沟通产出的过程。 就 vibe agent-dump / agent-view ,但是很多时候我自己想要回溯看看某个会话的问题的时候,就不是很方便。所以就有了 codesesh ,算是 agent-dump/agent-
领了激励计划的2亿token,马上用opencode试着做一个web app,功能自认为很简单直白: 构建一个图像对比看板应用。 技术栈: - React + TypeScript + Vite - Tailwind CSS 用于界面设计 - Zustand 用于状态管理 - F