DeepSeek-V4 的预览版本正式上线并同步开源
最期待的模型之一,希望能把 token 价格打下来
模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第74页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 2682 篇相关文章 · 第 74 / 135 页
最期待的模型之一,希望能把 token 价格打下来
GPT-5.5来了,大模型越来越像智能体了。今天凌晨OpenAI意外发布GPT-5.5。最核心的变化不是答案写得更漂亮,而是它更像一个能自己接活的系统:理解复杂目标,自己拆步骤、调工具、核结果,把一件多环节的任务从头推到尾。 OpenAI这次想卖的,不只是更聪明,而是真能干活。
内测群发的: DeepSeek-V4测试报告 model1: 优势: 该模型纯编程能力远强于Kimi-k2.6和GLM-5.1 模型上下文超长,利于大量文档阅读 劣势: 该模型未经过Agent使用环境优化 特征一:“亲历亲为”:模型极少使用SubAgent,导致上下文迅速膨胀 特
deepseek v4终于出来了,国内大模型以deepseek为首再次集体抬头,直逼三巨头 12 个帖子 - 7 位参与者 阅读完整话题
从该评论继续讨论: 小米发布了MiMo-V2.5-Pro模型,有用过的感觉效果怎么样吗? 昨天使用了社区佬友分享的 mimo-v2.5-pro,当时解决了我一个困扰已久的问题,此问题 gpt-5.4/glm-5.1 都没有解决,今天又遇到一个类似的问题,我决定试一试 初始提示词相
我电脑是m2 max 96G的,最近羊毛不好弄了,想本地部署一个大模型,求推荐适合代码的本地大模型,能偶尔用用的 4 个帖子 - 4 位参与者 阅读完整话题
还记得上次部署deepseek还是在上次 4 个帖子 - 3 位参与者 阅读完整话题
4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。 即日起登录官网 chat.deepseek.com 或官方App,即
DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。 最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Spars
(话题已被作者删除) 1 个帖子 - 1 位参与者 阅读完整话题
现在新出的模型 deepseekv4 pro 862B参数,GLM5.1 754B参数,kimi 2.6 1.1T的参数。像千问这种397B的是不是以后就不会有了。 想在公司八卡L20上部署一下新模型,算了一下量化后都不够部署上去。部署成本太高了,qwen3.6的满参数迟迟不发布
感觉很复杂,现在工作难度、工作强度相比之前大幅下降,但是工作内容的边界借助 AI 大幅拓展了,工作中的成就感其实是上升的,看到各种新模型的能力,也会觉得很欣喜 另一方面也确实会有一点被全面替代,无力抵抗的焦虑 好在目前这些感受还不影响我
我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代 国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群 我感觉做运维行业,维护显卡集群以后应该工作比较吃香 电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊 感觉ds的更
佬们,请问,上门三个小米的模型, 开始建议使用哪个呢? 没办法,只能用小米的模型,我哭 1 个帖子 - 1 位参与者 阅读完整话题
基本资料 官方模型卡: DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main deepseek-4-pro 输入¥12,输出¥24,缓存1/12 上下文1m,最大输出384k 参数1600B,激活49B,参考3.2是685B
之前openrouter上elephant的1t版本: inclusionai/ling-2.6-1t:free 1 个帖子 - 1 位参与者 阅读完整话题
感觉很复杂,现在工作难度、工作强度相比之前大幅下降,但是工作内容的边界借助 AI 大幅拓展了,工作中的成就感其实是上升的,看到各种新模型的能力,也会觉得很欣喜 另一方面也确实会有一点被全面替代,无力抵抗的焦虑 好在目前这些感受还不影响我
Hermes Agent 维护参考文档 用途 :大模型快速索引 Hermes Agent 常用命令与配置 适用版本 :v0.x (持续更新,版本号以 hermes --version 为准) 来源站点 : Hermes Agent Documentation | Hermes A
一大早就看到了gpt5.5模型来了消息。同时看到了cpa 发布的realse 日志 赶紧更新cpa到最版本6.9.36 一查看订阅的模型发现居然没有5.5 ,裤子都脱了,就给个这? 同时也看了free账号的可用模型居然出来了 gpt-image-2. 这偷偷加的么 3 个帖子 -
最期待的模型之一,希望能把 token 价格打下来