DeepSeek V4 幻觉严重的逆天
接了个2api,调了半天 toolcall 使能还以为是自己瞎改 ds2api 导致的奇妙问题,结果上号一看气笑了,模型在自己意淫 toolcall 结果 10 个帖子 - 7 位参与者 阅读完整话题
v4 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第6页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 1024 篇相关文章 · 第 6 / 52 页
接了个2api,调了半天 toolcall 使能还以为是自己瞎改 ds2api 导致的奇妙问题,结果上号一看气笑了,模型在自己意淫 toolcall 结果 10 个帖子 - 7 位参与者 阅读完整话题
如图所示,某站上的截图,有大佬去试试咸淡不?我试了好像可以官网都可以问问题。不涉及推广。网址是这个:base64:aHR0cHM6Ly9rbm94LmNoYXQ= 1 个帖子 - 1 位参与者 阅读完整话题
DeepSeek联合北京大学、清华大学发布论文《Thinking with Visual Primitives》,提出一种新的多模态推理框架。 该框架的核心做法是将空间标记——坐标点和边界框——提升为模型思维链中的“最小思考单元”,在推理过程中直接交织使用,使模型在"思
在做数据分析,不清楚是不是正常的命中率,之前从来没试过调用官方api 不过按照调用次数来看,似乎也挺香的 11 个帖子 - 10 位参与者 阅读完整话题
claude code 开发者模式接入deepseek v4 list/model 可以拿到模型,但对话报错,有大佬知道为什么? 1 个帖子 - 1 位参与者 阅读完整话题
速度快而且非常便宜,梁圣继续给我冲,期待多模态的版本开放,如果后训练再侧重coding领域就更舒服了 3 个帖子 - 3 位参与者 阅读完整话题
这几天一直在刷 DeepSeek V4,各种测试加上各种日常使用一起上 不知不觉已经烧 65.5M tokens 了 有没有人更猛的?来晒一下用量,顺便说说都拿来干嘛用 22 个帖子 - 15 位参与者 阅读完整话题
开源代码编辑器 Zed 日前正式发布 1.0 版本。开发团队表示,这并不意味着产品已经“完全完成”或“尽善尽美”,而是说明它已经跨过一个关键门槛,足以让开发者更放心地在日常工作中采用;如果用户在过去一两年里体验过 Zed 却觉得功能仍显不足,那么现在或许值得重新尝试,因为这款编辑
核心诉求: 找个DeepSeekv4Pro/Mimo2.5的低价渠道,并且量大。 如果佬喜欢听我吹水的话,具体原因: 且听我慢慢道来: 前一段时间谷 的Antigravity挺好用并量大,混了个ultra家庭组,反代opus &3Pro,每天大几百万,围绕这一套建了个Wo
首先我们分一下类: 结构化报告类(商业/技术 分析/研究/调研报告) 技术文档类(用户手册、项目文档) 营销/职场实用文(文案、纪要、社交媒体) 教育/知识转化类(知识点讲解、文件转笔记、科普文章) 创意/叙事类(小说) 深度长文(深度博客、公众号文章、观点输出) 其他 我个人尝
标题有点开玩笑了别介意。其实是最后一条user消息的最后插入system prompt可以极大概率影响思维链,导致看上去就是完美扮演了system prompt该有的作用。不过遵从概率并不是百分之百,而且最好是始终遵从系统指令放在最后的格式,如果中途崩坏有可能永远都救不回来了。
做个可以自由旋转的魔方的前端页面历经5轮对话,功能才能勉强实现。 第6轮对话让他模型更精致点,结果就功能失常,还在检修中 win 版 opencode ============================================= 思考5分钟,问题没有解决,有的难受。
请问佬友们,有用trae国际版的吗?自定义模型接入deepseek-v4为什么很慢呢? 我用opencode使用deepseek-v4的速度就很正常 1 个帖子 - 1 位参与者 阅读完整话题
不会偷懒(让我写一个简单版本…)也不用去想怎么破限制,1m上下文和缓存也能使劲造,真是太爽了 2 个帖子 - 2 位参与者 阅读完整话题
从 话说都V4了,DeepSeek现在还不是多模态吗 继续讨论: 大号没有 小号反而有 真随机啊 感觉可能是中等梯队 看博主测试并不是非常惊艳,大部分其他也会错的,他也会错 我还是比较关心文字OCR,我去试一下 ds经典的OCR错误率90%,太离谱了(手写文字 相对于豆包专家的3
deepseek v4 pro ≈ GLM5.1 > MiMO-2.5Pro > DeepSeek V4 FLASH 。 一个真实的中型项目,处于开发阶段,心血来潮使用四个官方来源的API接口使用同一套提示词进行review, 然后将其检查报告发给gpt 5.5 打分
然后发现基本上"AI味"集中在绪论和相关工作部分。仔细又检查了下,很多文字确实仔细看来还是挺“gpt”的。。基本上都重写了。果然再怎么用skill和约束还是不太行,还是要人工检查。 哦对了英文摘要部分也是重灾区,我用claude重写一遍那部分AI率还是100%
谢谢你,D老师,大晚上关着灯,看着屏幕笑出了声 7 个帖子 - 6 位参与者 阅读完整话题
IT之家 4 月 29 日消息,华为官方今日宣布,鸿蒙“龙虾”小艺 Claw 迎来重磅更新, 上线“自进化”能力 。在 11.6.3.300 新版本上线后,对小艺提出“记住这种风格”、“以后都用这种格式”、“永远都不要犯这种错”这类要求时, 它会识别并学习长期偏好,可减少重复沟通
在使用cherry studio调用DeepSeek官方API时发现的,模型会频繁出现忽略输入内容的情况。 具体表现为,当单次输入的prompt内容较长时,比如超过10000tokens,大模型的输出结果就明显看出来,它忽略了前5000个输入token,实际使用过程中甚至出现过忽