模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第90页 - 钛刻科技 | TCTI.cn

模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第90页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 2784 篇相关文章 · 第 90 / 140 页

[问与答] 是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1

除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的

tech v2ex.com 2026-04-23 15:19:17+08:00

小米首次登顶全球开源大模型第一?用过的来说说感受

实际体感如何呀? 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-23 15:17:20+08:00

[问与答] 是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1

除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的

tech v2ex.com 2026-04-23 15:14:29+08:00

DeepSeek V4 这周会出吗?

国产模型是不是要崛起了

tech www.v2ex.com 2026-04-23 15:07:54+08:00

DeepSeek V4 这周会出吗?

国产模型是不是要崛起了

tech www.v2ex.com 2026-04-23 15:07:54+08:00

关于1.5B模型function calling问题

有佬友做过类似的项目嘛,我现在在构建数据集,有个疑问就是tool use的训练是让模型直接输出[tool use]: 还是先thinking:需要干嘛,所以要[tool use]好呢 6 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-23 15:06:59+08:00

分享一个实用的论证: 如果让模型对自己的生成内容进行审查, 审查迭代次数=3可以获取最高边际收益

Yang, Z. et al. (2025). “A Probabilistic Inference Scaling Theory for LLM Self-Correction.” EMNLP 2025 . https://arxiv.org/abs/2508.16456 老哥

tech linux.do 2026-04-23 15:06:34+08:00

为啥感觉 gpt 比国产模型便宜多了,是错觉吗?

国产是 coding plan 和 api 便宜,但是产品级订阅贵得要死,gpt 20 刀几乎畅用,国产你跑几个复杂点的任务就限额了,堪比 claude 20 刀的感觉(如果是入门套餐还不如 claude 20 刀)。你让它给你根据几份文件,做个 ppt 之类,它都能很快撞限额,

tech www.v2ex.com 2026-04-23 15:03:09+08:00

为啥感觉 gpt 比国产模型便宜多了,是错觉吗?

国产是 coding plan 和 api 便宜,但是产品级订阅贵得要死,gpt 20 刀几乎畅用,国产你跑几个复杂点的任务就限额了,堪比 claude 20 刀的感觉(如果是入门套餐还不如 claude 20 刀)。你让它给你根据几份文件,做个 ppt 之类,它都能很快撞限额,

tech www.v2ex.com 2026-04-23 15:03:09+08:00

求问xiaomi 模型真实情况如何

在opencode排行上小米模型能排行前5 还是上个版本的v2,这几天新版v2.5出来了,不知有没有佬友使用过,感觉如何。 国外claude code模型太贵而且动不动就封号烦了,准备改成支持国内模型,最近kimi2.6,glm5.1,还有这个小米的MiMo-V2-Pro,不知道

tech linux.do 2026-04-23 14:57:58+08:00

[问与答] 是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1

除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的

tech v2ex.com 2026-04-23 14:57:57+08:00

DeepSeek V4 这周会出吗?

国产模型是不是要崛起了

tech www.v2ex.com 2026-04-23 14:54:33+08:00

[问与答] 是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1

除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了 gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的

tech v2ex.com 2026-04-23 14:50:41+08:00

为啥感觉 gpt 比国产模型便宜多了,是错觉吗?

国产是 coding plan 和 api 便宜,但是产品级订阅贵得要死,gpt 20 刀几乎畅用,国产你跑几个复杂点的任务就限额了,堪比 claude 20 刀的感觉(如果是入门套餐还不如 claude 20 刀)。你让它给你根据几份文件,做个 ppt 之类,它都能很快撞限额,

tech www.v2ex.com 2026-04-23 14:47:33+08:00

make slay the spire great again

gpt这个生图模型真好玩啊,跟之前大香蕉2刚出的时候一样玩的不亦乐乎,可惜就是我的灵感不够多了 上班时间只要不上班,干什么都好玩 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-23 14:44:42+08:00

求教多模型使用方式

佬们,求教一个问题。 有好多家模型的ApiKey,想在一个终端中切换使用这些模型,是否可行。 目前的操作的是通过 CCSwitch(主要是切换codex配置用) + CPA 在codex终端只能使用gpt模型,想使用Grok、Claude、Glm等模型,应该怎么操作啊 真心求教!

tech linux.do 2026-04-23 14:40:34+08:00

[职场话题] 大模型对于职场中的沟通能力差的人群的影响

今天跟同事沟通一个任务,我需要他帮忙完成一个他负责的程序中的改动,并将改动后的示意图发给我。一整个上午我断断续续跟他在微信上沟通了几次,还是沟通不清楚,他提出当面沟通来对齐。我急了,把上下文告诉 llm ,初始指令+微调一共用了不到 150 个字,在他来找我之前,就把我要的东西做

tech v2ex.com 2026-04-23 14:38:37+08:00

DeepSeek V4 这周会出吗?

国产模型是不是要崛起了

tech www.v2ex.com 2026-04-23 14:37:26+08:00

opencode go 订阅可以配置在别的客户端中使用么?

我看官网go的文档提供了模型的端点,是不是意味着第三方cli也可以用? 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-23 14:37:25+08:00

openai 数据共享计划模型更新了

https://help.openai.com/en/articles/10306912-sharing-feedback-evaluation-and-fine-tuning-data-and-api-inputs-and-outputs-with-openai 1M toke

tech linux.do 2026-04-23 14:30:57+08:00