DeepSeek V4终于来了,性能如何?用agent效果如何?
这波更新能打疼GPT 和 A/ 吗? 不是之前一个谣言就那么多热点热度, 这次真上线了,好像没什么讨论啊(我刚起床打开某音/知乎) 我就是个爱折腾新东西的玩家,偶尔用codex/cc/opencode 写些小工具, 用AI agent (hermes/龙虾/nanobot)去运维
Deep - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第38页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 1358 篇相关文章 · 第 38 / 68 页
这波更新能打疼GPT 和 A/ 吗? 不是之前一个谣言就那么多热点热度, 这次真上线了,好像没什么讨论啊(我刚起床打开某音/知乎) 我就是个爱折腾新东西的玩家,偶尔用codex/cc/opencode 写些小工具, 用AI agent (hermes/龙虾/nanobot)去运维
官方说这是预览版,那正式版是不是就更强了呀,不是完全体评分都在开源第一梯队了,如果是正式版,会不会有多模态能力捏~~以前看到有佬许愿要大上下文窗口,应验了,我们是不是可以期待一手多模态了,然后等 昇腾950 部署好了,再把多模态上了,来个正式版V4,perfect! 3 个帖子
参考文章: https://36kr.com/p/3780399181878528 -DeepSeek-V4 明确支持华为昇腾 950 芯片 支持国产芯片的 v4 下半年 token 价格还会大幅降低,DeepSeek 内部体验评价优于 Claude Sonnet 4.5 ,能用
API Error: 400 {“error”:{“type”:“invalid_request_error”,“message”:“The reasoning_content in the thinking mode must be passed back to the API
早期,我用 deepseek-reasoner 连最基本的问题在生产项目都搞不定。但是 V4 确实能力比之前强很多了。token 也很贵,一个简单的问题 V4 Pro 花了我 5 块钱多钱
早期,我用 deepseek-reasoner 连最基本的问题在生产项目都搞不定。但是 V4 确实能力比之前强很多了。token 也很贵,一个简单的问题 V4 Pro 花了我 5 块钱多钱
DeepSeek 4 上了,说是用来编程的,但是这个价格。。。 有没有富哥来分享一下体验感? https://imgur.com/a/z62cUo0
今天看到 DeepSeek 4.0 刚发布,顺手接到自己这边跑了下,还可以,免费给佬友蹬 https://openaiapi.xyz key:sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo 模型名:deepseek-v4-f
今天看到 DeepSeek 4.0 刚发布,顺手接到自己这边跑了下,还可以,免费给佬友蹬 https://openaiapi.xyz key:sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo 模型名:deepseek-v4-f
今天看到 DeepSeek 4.0 刚发布,顺手接到自己这边跑了下,还可以,免费给佬友蹬 https://openaiapi.xyz key:sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo 模型名:deepseek-v4-f
官网 DS4 专家模式,问题:如何只用一刀把四个一模一样的橘子:平均分给四个小朋友 看有人发小红书,我还以为 P 的,没想到自己上去试一下居然是真的 猜测用了贴吧的数据没处理好: https://tieba.baidu.com/p/8116300941
Key Takeaways 要点总结 Claude Opus 4.7 now leads at 71.00% overall accuracy, ahead of GPT 5.4 (67.42%), GPT 5.3 Codex(61.77%), and Claude Opus 4
同样来自Nao佬的网站 接上一篇编程测试: Deepseek v4 Pro的编程评测 - 前沿快讯 - LINUX DO (排行方式:中位分数) 网站: LLM Benchmark Dashboard 1 个帖子 - 1 位参与者 阅读完整话题
今天Deepseek正式发布了v4版本。然后看官方的这个介绍来说,快速模式就是对应Flash,专家模式就是对应Pro。 但是在这v4正式发布之前的时候,deepseek已经有了快速模式和专家模式选择。那么之前灰度的模型到底是什么?各位有没有什么测试? 究竟是一直用Flash,还是
用了一个 kimi 官网的 Agent 的示例 Prompt: 「 Meridian Architecture 」高端建筑设计事务所官网,展示项目作品、设计理念、团队、获奖、联系表单、留言簿。中英双语、极简主义建筑美学、深色系(黑/深灰)+ 金铜色点缀。区块:Hero (全屏摩天
官网 DS4 专家模式,问题:如何只用一刀把四个一模一样的橘子:平均分给四个小朋友 看有人发小红书,我还以为 P 的,没想到自己上去试一下居然是真的 猜测用了贴吧的数据没处理好: https://tieba.baidu.com/p/8116300941
早期,我用 deepseek-reasoner 连最基本的问题在生产项目都搞不定。但是 V4 确实能力比之前强很多了。token 也很贵,一个简单的问题 V4 Pro 花了我 5 块钱多钱
官网 DS4 专家模式,问题:如何只用一刀把四个一模一样的橘子:平均分给四个小朋友 看有人发小红书,我还以为 P 的,没想到自己上去试一下居然是真的 猜测用了贴吧的数据没处理好: https://tieba.baidu.com/p/8116300941
从 Deepseek v4 pro 3d魔方简要测试 帖子继续 原本测试 只在cherry studio 里面使用auto模式测试 在cherry studio 不知道如何改用max思考模式 现在使用claude + max 思考等级测试 api 耗费 4.39元 思考加首次交付