怎么感觉deepseek-v4-pro max在超过400k上下文时,注意力机制缺陷很大?
一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。 当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后 加埋点→收集日志
V4 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 1022 篇相关文章 · 第 3 / 52 页
一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。 当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后 加埋点→收集日志
另外为啥火山引擎平台没有上架 deepseek v4
另外为啥火山引擎平台没有上架 deepseek v4
nb_dbOJXOfQeXI8A5yIL6KpU2v9M4DrFFU4dSPoOrYv4DY https://api.krill-ai.com/coding 额度跑完就停 支持 anthropic 协议、openai completion 协议 包含模型:GLM-5.1 、qwe
nb_dbOJXOfQeXI8A5yIL6KpU2v9M4DrFFU4dSPoOrYv4DY https://api.krill-ai.com/coding 额度跑完就停 支持 anthropic 协议、openai completion 协议 包含模型:GLM-5.1 、qwe
另外为啥火山引擎平台没有上架 deepseek v4
最近想试试在codex app使用dsv4 3 个帖子 - 3 位参与者 阅读完整话题
好几周前就听说了v4要出,我用过文心、千问、minimax和glm等,比较好用的也就glm5了,平常还是gpt和cc用的多。我同事是坚定的国产模型拥护者,上班一直给我吹v4有多么牛,我先前用过ds v3,吐token是挺快,但是幻觉率挺高。 昨天充了5块,改了下配置文件直接用de
另外为啥火山引擎平台没有上架 deepseek v4
另外为啥火山引擎平台没有上架 deepseek v4
另外为啥火山引擎平台没有上架 deepseek v4
Deepseek 用了几天,我感觉单任务消耗的 token 相比 GPT,Sonnet,甚至 M2.7 都更多,而且多了不是一点,GPT 100k 左右的任务,DS 直接计算了 5M 的 token 使用,顿时感觉这按任务算费用 DS 的优势好像也不是很明显,牛马类工作我还是转回
另外为啥火山引擎平台没有上架 deepseek v4
另外为啥火山引擎平台没有上架 deepseek v4
另外为啥火山引擎平台没有上架 deepseek v4
最近把不少常规 API 都换成了 DeepSeek v4 pro,虽然还没深度重构工作流,但总体体验还算不错,网上风评看起来也好像挺好的,很多人已经接入了CC了。 越用越觉得,DeepSeek 简直就是大模型界的小米:你可以不用它,但你必须感谢它。 现在的行业定价逻辑挺简单的:D
看佬友说搞逆向不错,想试试水,有佬友指路嘛。 4 个帖子 - 4 位参与者 阅读完整话题