同一个模型,在不同的agent里表现差异会很大么?
一直有听说模型厂商会使用自家的coding agent进行训练,所以gpt+codex / claude + claude code 应该是表现最佳的组合?但是日常使用中体感上感觉不太明显,有什么数据能直观体现同一个模型在不同 coding agent 里的差异么? 1 个帖子
差异 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 53 篇相关文章 · 第 1 / 3 页
一直有听说模型厂商会使用自家的coding agent进行训练,所以gpt+codex / claude + claude code 应该是表现最佳的组合?但是日常使用中体感上感觉不太明显,有什么数据能直观体现同一个模型在不同 coding agent 里的差异么? 1 个帖子
如题,想要在本地养一下,但是有点纠结是养虾还是养马,有有经验的佬友给拆解一下这俩的差异性和推荐养哪个吗 ,比如从生态,安全,易用性等方面 5 个帖子 - 5 位参与者 阅读完整话题
(话题已被作者删除) 1 个帖子 - 1 位参与者 阅读完整话题
大家在vibe coding的时候,有对比过claude code cli和calude.app中的code有什么差异?我之前一直用cli,现在转到app,不知道有没有什么需要注意的地方~ 1 个帖子 - 1 位参与者 阅读完整话题
pro目前用不用到。到线下店去试发现没啥差异。最后网购拿下。 2 个帖子 - 2 位参与者 阅读完整话题
gpt普号差异好大,有些可以调用100多次,总token 10M左右,有些调用40来次,总token才4左右。这跟邮箱有关系吗 5 个帖子 - 5 位参与者 阅读完整话题
目前使用cc、codex、opencode,感觉不出来agent客户端对AI coding的影响有多大,佬们有没有agent客户端测评的? 11 个帖子 - 5 位参与者 阅读完整话题
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
有感于最近 V2EX 看到太多情感贴,其中一大半会让人有劝和/劝分的差异评论出现,进而对人们的这种差异来源感到好奇,所以我周末 vibe 了一个小产品,就叫 「这俩人合适吗?」 其中的数据一部分来自于 AI 生成(选用世界上最贵的模型),一部分来自于真实的人的投稿 投票之后你可以
今天开始,gemini也开始这种标准和思考模式,今天开始御三家都一样的模型定位差异 2 个帖子 - 2 位参与者 阅读完整话题
起因 :codex为了保证用户体验,当你5小时限额到期了,但是任务还没有执行完,codex会优先将此次任务结束,此时其实你已经没有额度了,多的额度就是白嫖的。 我之前一直以为,多蹭的额度会在周限额里扣掉。 昨天,我在app里,刚好剩下2%额度的时候,功能做完了,我去人工测试有好几
最近感悟 多年来 发现如今的情况很有差异 以前大家很多都是国内风景好的地方玩 现在经济这么差 分化严重 都很多去国外的 今天洛杉矶 明天卢森堡 后天新加坡 挤地铁的上班族 失业的蹲家里 等等 比以前的状态更魔幻 阶层更细化 这不像我认为的2026! 1 个帖子 - 1 位参与者
小试了一下 trae 中这两款热门模型,没想到跟我的固有印象竟有些差异 早期我是妥妥的 GLM 黑子,这次我对他有了些许改观 先上图 这是今天两者的用量 本文仅代表今天我的使用感受,没有对模型进行量化评分 代码质量 出乎意料的,glm 被我编写的代码质量 ci 拦截概率更低,ds
IT之家 5 月 8 日消息,今天(8 日)下午,“去哪儿官宣”公众号发文称,公司坚决拥护并积极响应监管要求,将专项治理视为提升平台服务质量、构建清朗网络空间的重要契机,确保算法应用合法、合规、公平、透明。 目前,去哪儿已对照专项治理清单要求,深度开展算法模型的自查整改工作。 I
前些天偶然间看到推上有人说GPT和Claude的性格差异,大概意思是,GPT能更好的遵守指令,越细化的指令执行的结果就越好;Claude则对指令容忍度较高。 我让GPT检索了一下来源,应该是从Cursor的 这篇文章 里来的。 OpenAI’s models tend to be