de - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第578页 - 钛刻科技 | TCTI.cn

de - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第578页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 15357 篇相关文章 · 第 578 / 768 页

国外的 Vibe Code 测评排行:opus 4.7、gpt-5.5、deepseek V4、Kimi K2.6……等

Key Takeaways 要点总结 Claude Opus 4.7 now leads at 71.00% overall accuracy, ahead of GPT 5.4 (67.42%), GPT 5.3 Codex(61.77%), and Claude Opus 4

tech linux.do 2026-04-24 18:15:06+08:00

Deepseek v4系列模型的推理能力排行

同样来自Nao佬的网站 接上一篇编程测试: Deepseek v4 Pro的编程评测 - 前沿快讯 - LINUX DO (排行方式:中位分数) 网站: LLM Benchmark Dashboard 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 18:08:25+08:00

Deepseek今天之前的快速和专家模式对应的是什么模型

今天Deepseek正式发布了v4版本。然后看官方的这个介绍来说,快速模式就是对应Flash,专家模式就是对应Pro。 但是在这v4正式发布之前的时候,deepseek已经有了快速模式和专家模式选择。那么之前灰度的模型到底是什么?各位有没有什么测试? 究竟是一直用Flash,还是

tech linux.do 2026-04-24 18:08:12+08:00

g有没有佬在claude code中使用gpt5.5的,效果怎么样

如题,有没有佬友在claude code使用最新的gpt 5.5的 coding能力相当于codex怎么样 有没有提升呢 6 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-24 18:07:29+08:00

Vibe coding 有什么意义?

除了做 demo ,任何一个需要稳定性的系统都不应该使用 vibe coding 实现。全黑盒,完全不可控。 之前的一家公司,PM 开始自己 vibe coding ,推到上线后结果完全不可维护,到最后还是研发来擦屁股。产品爽了,最后烂摊子研发全接走?

tech www.v2ex.com 2026-04-24 18:07:23+08:00

Vibe coding 有什么意义?

除了做 demo ,任何一个需要稳定性的系统都不应该使用 vibe coding 实现。全黑盒,完全不可控。 之前的一家公司,PM 开始自己 vibe coding ,推到上线后结果完全不可维护,到最后还是研发来擦屁股。产品爽了,最后烂摊子研发全接走?

tech www.v2ex.com 2026-04-24 18:07:23+08:00

Vibe coding 有什么意义?

除了做 demo ,任何一个需要稳定性的系统都不应该使用 vibe coding 实现。全黑盒,完全不可控。 之前的一家公司,PM 开始自己 vibe coding ,推到上线后结果完全不可维护,到最后还是研发来擦屁股。产品爽了,最后烂摊子研发全接走?

tech www.v2ex.com 2026-04-24 18:07:23+08:00

一个例子又拉回了我对 DeepSeek V4 Pro 的印象,后续还是得多多测试看看

用了一个 kimi 官网的 Agent 的示例 Prompt: 「 Meridian Architecture 」高端建筑设计事务所官网,展示项目作品、设计理念、团队、获奖、联系表单、留言簿。中英双语、极简主义建筑美学、深色系(黑/深灰)+ 金铜色点缀。区块:Hero (全屏摩天

tech www.v2ex.com 2026-04-24 18:06:01+08:00

[分享发现] DeepSeek4 的数据没清理好啊,估计有得折腾

官网 DS4 专家模式,问题:如何只用一刀把四个一模一样的橘子:平均分给四个小朋友 看有人发小红书,我还以为 P 的,没想到自己上去试一下居然是真的 猜测用了贴吧的数据没处理好: https://tieba.baidu.com/p/8116300941

tech v2ex.com 2026-04-24 18:04:18+08:00

[Codex] codex 中转,留邮箱就送。

5 刀( 24h )额度,仅限 codex 模型,有国内 cdn 线路 帖子下留邮箱就送! 官网: https://www.krill-ai.com ps:仅限个人合理使用,分发会封号 ------------活动日期截至 4 月 26 日 只要留了的,都送 后续看情况继续---

tech v2ex.com 2026-04-24 18:03:49+08:00

GPT5.5 在 codex 中 credit 消耗量相比 5.4 翻倍

https://developers.openai.com/api/docs/pricing?latest-pricing=standard Model Input Credits Output Credits GPT-5.3-Codex 43.75 350 GPT-5.4 62

tech www.v2ex.com 2026-04-24 18:02:59+08:00

天下苦 Claude 久矣, GPT 就出招了, 5.5 目测下限是 opus 4.6

1 ,输出好多了,不讲八股文了 2 ,体感变快 2 ,大上下文目测增强很多 解决了 5.4 最大的 l 几个问题,可主力使用。 我想说出早了,再等 1-2 周,Claude 继续硬着脖子说自己模型没问题。等着 claude 的口碑再烂点。奥特曼太着急了

tech www.v2ex.com 2026-04-24 18:01:50+08:00

帮大家试过了 V4 变强了,但是也太贵了,早点出 coding plan 吧

早期,我用 deepseek-reasoner 连最基本的问题在生产项目都搞不定。但是 V4 确实能力比之前强很多了。token 也很贵,一个简单的问题 V4 Pro 花了我 5 块钱多钱

tech www.v2ex.com 2026-04-24 18:01:46+08:00

[分享发现] DeepSeek4 的数据没清理好啊,估计有得折腾

官网 DS4 专家模式,问题:如何只用一刀把四个一模一样的橘子:平均分给四个小朋友 看有人发小红书,我还以为 P 的,没想到自己上去试一下居然是真的 猜测用了贴吧的数据没处理好: https://tieba.baidu.com/p/8116300941

tech v2ex.com 2026-04-24 17:58:09+08:00

[Codex] codex 中转,留邮箱就送。

5 刀( 24h )额度,仅限 codex 模型,有国内 cdn 线路 帖子下留邮箱就送! 官网: https://www.krill-ai.com ps:仅限个人合理使用,分发会封号 ------------活动日期截至 4 月 26 日 只要留了的,都送 后续看情况继续---

tech v2ex.com 2026-04-24 17:58:08+08:00

Deepseek v4-pro 3d魔方重新测试

从 Deepseek v4 pro 3d魔方简要测试 帖子继续 原本测试 只在cherry studio 里面使用auto模式测试 在cherry studio 不知道如何改用max思考模式 现在使用claude + max 思考等级测试 api 耗费 4.39元 思考加首次交付

tech linux.do 2026-04-24 17:58:00+08:00

GPT5.5 在 codex 中 credit 消耗量相比 5.4 翻倍

https://developers.openai.com/api/docs/pricing?latest-pricing=standard Model Input Credits Output Credits GPT-5.3-Codex 43.75 350 GPT-5.4 62

tech www.v2ex.com 2026-04-24 17:56:54+08:00

DeepSeek V4 终于出来了。。不知道强不强

tech www.v2ex.com 2026-04-24 17:56:14+08:00

codex5.3转sonnet4.6后明显感觉代码返修频率增加了

不知道是不是错觉的问题,之前一直用佬的公益codex 5.3/5.4 几乎代码都是一把过,最近额度不够了,在copilot上用sonnet4.6为主,给我弄出来不少BUG,新任务也经常一次不到位需要多次校对,是错觉还是codex这方面确实要更严谨 13 个帖子 - 11 位参与者

tech linux.do 2026-04-24 17:55:53+08:00

这下minimax真成路边一条了

感觉 deepseek v4 flash 比 minimax m2.7 聪明还更便宜,要是有 coding plan 上了ds这 minimax 真要成啥了 12 个帖子 - 12 位参与者 阅读完整话题

tech linux.do 2026-04-24 17:54:50+08:00