Yifan Zhang 透露了DeepSeek V4参数
Yifan Zhang:本科北大元培、硕士清华姚班,现为普林斯顿大学 AI Lab Fellow,研究方向是大语言模型推理与强化学习 这哥们儿不是DeepSeek的员工,但估计和DeepSeek关系挺密切的,之前几次预测都说对了。 这次他披露的: V4 1.6T, V4-Lite
deepseek - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第63页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 1352 篇相关文章 · 第 63 / 68 页
Yifan Zhang:本科北大元培、硕士清华姚班,现为普林斯顿大学 AI Lab Fellow,研究方向是大语言模型推理与强化学习 这哥们儿不是DeepSeek的员工,但估计和DeepSeek关系挺密切的,之前几次预测都说对了。 这次他披露的: V4 1.6T, V4-Lite
4 个帖子 - 4 位参与者 阅读完整话题
据The Information:中国科技巨头腾讯控股和阿里集团正在洽谈投资DeepSeek,这家人工智能新兴公司最近首次开始筹资。一位知情人士透露,DeepSeek目前正寻求以超过200亿美元估值筹集资金。 4 个帖子 - 4 位参与者 阅读完整话题
现在又变回128k长下文了,很难绷啊感觉在耍我们 9 个帖子 - 7 位参与者 阅读完整话题
《The Information》援引四名知情人士称,腾讯和阿里巴巴正在洽谈投资 DeepSeek。DeepSeek 由量化对冲基金幻方量化持有,此前从未接受外部资金。《The Information》上周五率先报道 DeepSeek 启动首轮融资,目标为至少 3 亿美元、估值不
官方平台调用,但是官网还是显示v3.2为现有版本,大的终于来了吗 3 个帖子 - 2 位参与者 阅读完整话题
这个月还剩下一周左右时间,最大的期待就是DeepSeek V4了,从种种迹象来看是越来越近了,而且官方近期也是动作不断,现在被发现API也开始升级模型了,性能还不错。从2月8日宣布上线了一个测试版之后,DeepSeek V4实际上一直都在低调变化,只是每次官方都没有详细介绍升级内
DeepSeek 官网问的 2 个帖子 - 2 位参与者 阅读完整话题
刚刚在谷歌搜deepseek v4看到个连接就点进去了,发现引用了咋们站里一位佬的评论 源连接 cnBeta.COM DeepSeek V4又在测试:被指接近Opus 4.5 但不会太便宜 - AI 人工智能 - cnBeta.COM 这个月还剩下一周左右时间,最大的期待就是De
用的时候发现回答风格变了,一问,果然是新模型。
13 个帖子 - 12 位参与者 阅读完整话题
用的时候发现回答风格变了,一问,果然是新模型。
有没有深度使用 kimi2.6 和 glm5.1 的?哪个套餐能平替 gpt5.4(free),deepseek 一直没出留个坑作为推理模型。另外我对前端要求低…主要要会说人话、会主动调各种 skill、cli 工具、coding 后 fix bug 能接近 gpt 就行了。 8
用的时候发现回答风格变了,一问,果然是新模型。
api换成app的模型了,大的可能真的要来力,今天用api时候发现的提示词已经改了 11 个帖子 - 6 位参与者 阅读完整话题
DeepSeek开放平台疑似更新了后端的模型,模型自认知上下文均为1m。体感类似于web端先前更新的。 但是实际测试中,上下文只有在200k以下才能正常使用,超过200k会报600s超时。 超时报错:{“error”:{“message”:“We were unable to s
用的时候发现回答风格变了,一问,果然是新模型。
IT之家 4 月 22 日消息,今日有大量用户反馈称,DeepSeek 官方 API 已经更新到了与客户端及网页版相同的 1M tokens 上下文版本(似乎是此前曝光的 DeepSeek V4 Lite),比之前的 128k 上下文更长。 与此同时,最新 DeepSeek 的知
使用的是这里面的测试文档: ⧉ 模型【大海捞针】测试!(含附件)这次肯定没有被预训练过!! 搞七捻三 (\ _ /) ( ・-・) /っ 上个贴说著名的小说可能被预训练过了 所以,这次来个肯定没有被预训练的数据集: 大海捞针测试《请不要把互联网上的戾气带来这里!》.txt (49
刚才测试了一下,突然回答自己有 1M 上下文,并且和官网一样说能吃下《三体》这么多的内容。 其他信息尚不明确,请佬友做更多测试。 1 个帖子 - 1 位参与者 阅读完整话题