[DeepSeek] deepseek-v4-flash 好像没大家说的这么智能啊?
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能 尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。 还有长记忆捞回测试,我上传了 900k 的武林
deep - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 1337 篇相关文章 · 第 3 / 67 页
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能 尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。 还有长记忆捞回测试,我上传了 900k 的武林
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能 尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。 还有长记忆捞回测试,我上传了 900k 的武林
快科技5月3日消息,4月24日DeepSeek V4系列大模型正式发布,距离去年的DeepSeek R1更新过去了15个月了,V4的性能到底如何也引发了国内外的讨论,美国人也非常关心。 评估DeepSeek V4的能力已经有很多测试了, 美国外交关系委员会组织了3个高级研究员之前
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能 尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。 还有长记忆捞回测试,我上传了 900k 的武林
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能 尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。 还有长记忆捞回测试,我上传了 900k 的武林
用了ds官api几天下来,用的都是pro(max)评价应该是国产性价比最高且兼顾能力的模型了而且能 1.按量购买 2.响应速度快 3.可在中国大陆直接使用,国产目前编码能力能与他争一争的也就只有GLM5.1,但GLM的sla极差,常常响应速度慢,而且ds基本没有道德感,这也是我使
当前最火的是下面几个: GLM-5.1 、 DeepSeek-V4 、 Kimi K2.6 、 MiniMax M2.7 、 通义千问 Qwen3 、 豆包 Seed 2.0 和 小米 MiMo V2.5 。 GLM-5.1 DeepSeek-V4 Kimi K2.6 MiniM
从 【picpi 皮皮工艺站】小店开门啦!工艺codex 100$/周 30天订阅兑换码开卖! 继续 工艺站主贴: 【picpi 皮皮公益站】主要自用 小规模开放 主力模型:OpenAI Codex 工艺站注册方式更新 前几天修改了发放规则,将基于用户数量的限制改为基于订阅数量的
各位大佬们,在综合实力对比哪个好用一点(在教人学习给建议,中文理解,理解中国信息,角色代入等等方面,或者更聪明一点?)如果你觉得我的问题太智障了请大胆的喷,我不介意我会认真看,因为实在是对这方面不了解,另外gemini不是pro版 4 个帖子 - 4 位参与者 阅读完整话题
1 个帖子 - 1 位参与者 阅读完整话题
v4p会有多模态吗?感觉智力上v4比较一般,但是注意力很不错。不过这个多模态是什么情况? 2 个帖子 - 2 位参与者 阅读完整话题
人工智能标准与创新中心(CAISI)近日完成了对开源人工智能模型 DeepSeek V4 Pro的全面评估。报告指出,尽管DeepSeek V4展示了卓越的性能,并在多项指标上大幅领先于国内同类模型,但其综合能力相较于美国最前沿技术仍有约8个月的代差。 CAISI的IRT(项目反
CC+DeepSeek-V4 Pro分别用了frontend-design、ui-ux-pro-max、impeccable 以及这三个 skill 同时构建的一个静态前端页面,佬友们评价一下。 入口页是 gpt5.5 实现的,gpt 的前端在让人失望这方面从来不让人失望。 提示
今天拿deepseek在写一个项目,然后因为需要配置代理,但是不知道为什么他抽风的改了系统代理然后电脑网络就直接崩了,去关了代理之后也只是能上网但是代理还是有问题,所有ai都已经连不上了 已经不知道怎么解决了,只能来求助各位佬友了 4 个帖子 - 4 位参与者 阅读完整话题
一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。 当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后 加埋点→收集日志
有没有用过的佬?是噱头还是真的有实力?还蛮期待的,star 数也是猛涨 6 个帖子 - 4 位参与者 阅读完整话题
我有一个 DeepSeek 网页版的专家模式的聊天,聊了一些开发习惯和领域驱动设计,感觉聊得很深入,DeepSeek 也理解了我的开发理念和习惯,我现在想以此为基础,聊一个别的项目。该怎么继续使用比较好呢? 我是不是应该,把重要的上下文先梳理规范一下,然后在开始一个新聊天之前,把
gpt最近封控严重啊,deepseek工程能力只相当于sonnet,但是能不能用于复杂推理任务呢,比如架构设计之类的。 10 个帖子 - 7 位参与者 阅读完整话题