到底怎么才能降低Qwen3.5-35B-A3B的think啊
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。 官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊.. system角色写提示词要求它精简思考过程也不行。。。。 没招了.. 1
US - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第98页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 3156 篇相关文章 · 第 98 / 158 页
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。 官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊.. system角色写提示词要求它精简思考过程也不行。。。。 没招了.. 1
色盲题85秒一次通过. Opus 4.7在CC上开max个人测试了3次以上,无法通过. 洗车题更是毫不费力. 9.9-9.11用的instant也是对的 这三题都是我在CC上测试Opus 4.7答不对的问题. 3 个帖子 - 3 位参与者 阅读完整话题
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
每天捏着鼻子用 A\的 Opus 真是恶心 DS 4 发布了,计划同步订阅,哪怕不用, 也支持下. 希望越做越好,把 A\,奥特曼的价格打一打!
每天捏着鼻子用 A\的 Opus 真是恶心 DS 4 发布了,计划同步订阅,哪怕不用, 也支持下. 希望越做越好,把 A\,奥特曼的价格打一打!
看了几个收藏的小店,全线涨价就不说了,plus 订阅都缺货了,只有 100+的 pro ,还都没质保,所以现在手里的号等到期了以后 codex 也不能爽蹬了是嘛:(((
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
IT之家 4 月 24 日消息,奇瑞捷途旅行者 PLUS 双车今日正式上市, 超级置换价 15.79 万元起 。 旅行者 PLUS 2.0TD XWD 征服大五座上市指导价 17.79 万元,超级置换价 15.79 万元 2.0TD XWD 征服七座上市指导价 17.99 万元,
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
之前openrouter上elephant的1t版本: inclusionai/ling-2.6-1t:free 1 个帖子 - 1 位参与者 阅读完整话题
今天GPT5.5和DeepSeek V4双日凌空,很久没见论坛卡成这样了。 设想一下,如果opus 4.7也今天发布,论坛怕是直接宕机回滚了吧 1 个帖子 - 1 位参与者 阅读完整话题
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了