测试deepseek 给我测笑了

先说现在的结论:至少ds真没说大话 也没搞什么预训练 或者说对什么测试过拟合 而且现在结果非常不稳定,自己看吧 测试均在cc中使用deepseek 官方api测试 deepseek v4 pro 开启max 这是我见过最疯狂的答案 这也挺疯狂的 还有答对到就差最后一步的 但是你不要觉得他答不对 拉煤...
测试deepseek 给我测笑了
测试deepseek 给我测笑了

先说现在的结论:至少ds真没说大话 也没搞什么预训练 或者说对什么测试过拟合

而且现在结果非常不稳定,自己看吧

测试均在cc中使用deepseek 官方api测试

deepseek v4 pro 开启max

image

image

这是我见过最疯狂的答案

image

这也挺疯狂的

image

还有答对到就差最后一步的

但是你不要觉得他答不对

image

拉煤题

image

image

我现在的想法就是 支持国模 好吧 既然 充了钱了 那就用 说下半年会便宜 那就下半年再充

不能再测这些东西了,我将跑一个之前做出来过的具体项目来测试一下其能力

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文