天下苦 Claude 久矣, GPT 就出招了, 5.5 目测下限是 opus 4.6
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
us - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第91页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 3023 篇相关文章 · 第 91 / 152 页
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
每天捏着鼻子用 A\的 Opus 真是恶心 DS 4 发布了,计划同步订阅,哪怕不用, 也支持下. 希望越做越好,把 A\,奥特曼的价格打一打!
Epoch AI Claude skews high-income; Meta AI skews low-income Household income of weekly AI users ranges from 80% earning $100K+ for Claude to
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
切换模型前,是我和opus的对话,大概有80k左右,大概是我让opus帮我改个东西,然后看到deepseek上线就赶紧切了试试… 结果就是完全无视我当前指令,认准一个地方乱冲… 那就…下次见吧 7 个帖子 - 7 位参与者 阅读完整话题
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。 官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊.. system角色写提示词要求它精简思考过程也不行。。。。 没招了.. 1
色盲题85秒一次通过. Opus 4.7在CC上开max个人测试了3次以上,无法通过. 洗车题更是毫不费力. 9.9-9.11用的instant也是对的 这三题都是我在CC上测试Opus 4.7答不对的问题. 3 个帖子 - 3 位参与者 阅读完整话题
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
每天捏着鼻子用 A\的 Opus 真是恶心 DS 4 发布了,计划同步订阅,哪怕不用, 也支持下. 希望越做越好,把 A\,奥特曼的价格打一打!
每天捏着鼻子用 A\的 Opus 真是恶心 DS 4 发布了,计划同步订阅,哪怕不用, 也支持下. 希望越做越好,把 A\,奥特曼的价格打一打!
看了几个收藏的小店,全线涨价就不说了,plus 订阅都缺货了,只有 100+的 pro ,还都没质保,所以现在手里的号等到期了以后 codex 也不能爽蹬了是嘛:(((
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/