模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第74页 - 钛刻科技 | TCTI.cn

模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第74页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 2682 篇相关文章 · 第 74 / 135 页

DeepSeek-V4 的预览版本正式上线并同步开源

最期待的模型之一,希望能把 token 价格打下来

tech www.v2ex.com 2026-04-24 12:38:10+08:00

GPT-5.5正式上线:跑分更猛价格翻倍 但这点不得不防

GPT-5.5来了,大模型越来越像智能体了。今天凌晨OpenAI意外发布GPT-5.5。最核心的变化不是答案写得更漂亮,而是它更像一个能自己接活的系统:理解复杂目标,自己拆步骤、调工具、核结果,把一件多环节的任务从头推到尾。 OpenAI这次想卖的,不只是更聪明,而是真能干活。

tech plink.anyfeeder.com 2026-04-24 12:36:27+08:00

deepseek 测评【转发】

内测群发的: DeepSeek-V4测试报告 model1: 优势: 该模型纯编程能力远强于Kimi-k2.6和GLM-5.1 模型上下文超长,利于大量文档阅读 劣势: 该模型未经过Agent使用环境优化 特征一:“亲历亲为”:模型极少使用SubAgent,导致上下文迅速膨胀 特

tech linux.do 2026-04-24 12:29:05+08:00

恭喜deepseek v4终于出来了,国模集体抬头

deepseek v4终于出来了,国内大模型以deepseek为首再次集体抬头,直逼三巨头 12 个帖子 - 7 位参与者 阅读完整话题

tech linux.do 2026-04-24 12:24:53+08:00

电子斗蛐蛐:小米mimo vs 智谱glm vs GPT

从该评论继续讨论: 小米发布了MiMo-V2.5-Pro模型,有用过的感觉效果怎么样吗? 昨天使用了社区佬友分享的 mimo-v2.5-pro,当时解决了我一个困扰已久的问题,此问题 gpt-5.4/glm-5.1 都没有解决,今天又遇到一个类似的问题,我决定试一试 初始提示词相

tech linux.do 2026-04-24 12:19:42+08:00

佬们,有没有本地大模型替代的

我电脑是m2 max 96G的,最近羊毛不好弄了,想本地部署一个大模型,求推荐适合代码的本地大模型,能偶尔用用的 4 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-24 12:16:45+08:00

DeepseekV4上线,模型在下了,昇腾的部署文档快端上来吧,已经饥渴难耐了

还记得上次部署deepseek还是在上次 4 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-24 12:16:10+08:00

DeepSeek-V4预览版本正式上线并开源

4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。 即日起登录官网 chat.deepseek.com 或官方App,即

tech plink.anyfeeder.com 2026-04-24 12:06:38+08:00

最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降

DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。 最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Spars

tech feeds.appinn.com 2026-04-24 12:05:20+08:00

请教一下各位佬,我这个配置能跑啥模型啊

(话题已被作者删除) 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 12:04:32+08:00

是不是以后想私有化部署满血开源模型越来越难了?

现在新出的模型 deepseekv4 pro 862B参数,GLM5.1 754B参数,kimi 2.6 1.1T的参数。像千问这种397B的是不是以后就不会有了。 想在公司八卡L20上部署一下新模型,算了一下量化后都不够部署上去。部署成本太高了,qwen3.6的满参数迟迟不发布

tech linux.do 2026-04-24 12:00:55+08:00

[问与答] 有一种矛盾的感受,一方面觉得 AI 马上要替代自己的工作了,另一方面又觉得层出不穷的 AI 工具和模型太让人幸福了

感觉很复杂,现在工作难度、工作强度相比之前大幅下降,但是工作内容的边界借助 AI 大幅拓展了,工作中的成就感其实是上升的,看到各种新模型的能力,也会觉得很欣喜 另一方面也确实会有一点被全面替代,无力抵抗的焦虑 好在目前这些感受还不影响我

tech v2ex.com 2026-04-24 11:57:33+08:00

算力,运维,电力

我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代 国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群 我感觉做运维行业,维护显卡集群以后应该工作比较吃香 电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊 感觉ds的更

tech linux.do 2026-04-24 11:55:33+08:00

开发只能使用小米的模型,佬请问下面的模型建议使用哪个呢?

佬们,请问,上门三个小米的模型, 开始建议使用哪个呢? 没办法,只能用小米的模型,我哭 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:54:14+08:00

【大模型系列33】关于Deepseek 4,你想知道的一切

基本资料 官方模型卡: DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main deepseek-4-pro 输入¥12,输出¥24,缓存1/12 上下文1m,最大输出384k 参数1600B,激活49B,参考3.2是685B

tech linux.do 2026-04-24 11:52:57+08:00

无人在意的角落,蚂蚁发布了一个1t的模型

之前openrouter上elephant的1t版本: inclusionai/ling-2.6-1t:free 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 11:47:22+08:00

[问与答] 有一种矛盾的感受,一方面觉得 AI 马上要替代自己的工作了,另一方面又觉得层出不穷的 AI 工具和模型太让人幸福了

感觉很复杂,现在工作难度、工作强度相比之前大幅下降,但是工作内容的边界借助 AI 大幅拓展了,工作中的成就感其实是上升的,看到各种新模型的能力,也会觉得很欣喜 另一方面也确实会有一点被全面替代,无力抵抗的焦虑 好在目前这些感受还不影响我

tech v2ex.com 2026-04-24 11:47:06+08:00

Hermes Agent 维护参考文档

Hermes Agent 维护参考文档 用途 :大模型快速索引 Hermes Agent 常用命令与配置 适用版本 :v0.x (持续更新,版本号以 hermes --version 为准) 来源站点 : Hermes Agent Documentation | Hermes A

tech linux.do 2026-04-24 11:46:10+08:00

gpt5.5来了,兴致冲冲更新了cpa 结果不能用5.5模型,

一大早就看到了gpt5.5模型来了消息。同时看到了cpa 发布的realse 日志 赶紧更新cpa到最版本6.9.36 一查看订阅的模型发现居然没有5.5 ,裤子都脱了,就给个这? 同时也看了free账号的可用模型居然出来了 gpt-image-2. 这偷偷加的么 3 个帖子 -

tech linux.do 2026-04-24 11:41:34+08:00

DeepSeek-V4 的预览版本正式上线并同步开源

最期待的模型之一,希望能把 token 价格打下来

tech www.v2ex.com 2026-04-24 11:38:10+08:00