最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降
DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。 最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Spars
de - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第687页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 17099 篇相关文章 · 第 687 / 855 页
DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。 最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Spars
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了
都是差不多时间出的,目前也没看到两个对比的信息,有没有都体验过的佬细说一下,开源模型后续的价格应该能降下来吧。个人感觉DeepSeek是不是藏的太久了,马速拉不过OAI和A\了。 12 个帖子 - 10 位参与者 阅读完整话题
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
最近在重度使用 codex app ,被官方价格 + 限制搞得有点烦… 干脆自己弄了个中转站,原本只是自己用的,刚好自己有一些上游渠道可以搞到一些相对低价的 pro 账号来轮询。 现在顺手放出来,有需要的可以试试。 支持的东西不多,目前就主打 codex ,支持最新的 GPT-5
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
有没有 V 友感觉最近 cc 看了五个小时 session 的 token usage 啊?这两天问不几轮对话就把五个小时的 usage 干满了,沟槽的 A/
推理不到点子上,整个推理过程就是无限的否定自己,推理能力堪比 qwen 的第一个推理模型 qwq-32b 。不能做到类似 glm5.1 那种言之有物,人看了会觉得真的在思考的效果。 kimi k2.6 还出现了一个非常低级的错误,我让他参考一个 kt 工程,我给了工程的文件夹路径
现在新出的模型 deepseekv4 pro 862B参数,GLM5.1 754B参数,kimi 2.6 1.1T的参数。像千问这种397B的是不是以后就不会有了。 想在公司八卡L20上部署一下新模型,算了一下量化后都不够部署上去。部署成本太高了,qwen3.6的满参数迟迟不发布
看到很多 V 友发帖说 claude 账号被封问题,我目前是使用 GooglePlay 订阅的 20 美元的 Pro 套餐,已经稳定订阅一年左右了。 目前感觉额度不够用,想升级到 5X 的 MAX(对应官网是 100 美元的)。 请问下,之前出现封号的都是 MAX 套餐的吗?是
提示词 (点击了解更多详细信息) Pro3.7s完成任务 而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话 其实是怕本来不多的余额没了 GPT那边的回答见 GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o
看到很多 V 友发帖说 claude 账号被封问题,我目前是使用 GooglePlay 订阅的 20 美元的 Pro 套餐,已经稳定订阅一年左右了。 目前感觉额度不够用,想升级到 5X 的 MAX(对应官网是 100 美元的)。 请问下,之前出现封号的都是 MAX 套餐的吗?是
看到网上的图,分数似乎跟GLM相同 价格还是可以的 有没有兄弟实际使用过,感受如何呢 或是体验有没有办法跟claude gpt扳一扳手脚 10 个帖子 - 9 位参与者 阅读完整话题
简单试了下天气卡片,中文英文都试了,太简陋了: 中文: 创建一个包含 CSS 和 JavaScript 的单一 HTML 文件,用于生成动画天气卡片。卡片应该通过不同的动画直观地表示以下天气状况: 风:(例如,移动的云朵、摇摆的树木或风线) 雨:(例如,下落的雨滴、形成的水坑)
简单试了下天气卡片,中文英文都试了,太简陋了: 中文: 创建一个包含 CSS 和 JavaScript 的单一 HTML 文件,用于生成动画天气卡片。卡片应该通过不同的动画直观地表示以下天气状况: 风:(例如,移动的云朵、摇摆的树木或风线) 雨:(例如,下落的雨滴、形成的水坑)