30 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第34页 - 钛刻科技 | TCTI.cn

30 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第34页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 1254 篇相关文章 · 第 34 / 63 页

我的爱马仕调教的太好了,一个指令咣咣干掉1/3 的 team 5 hour 额度

之前用GLM 5.1 一个指令动不动就能跑30分钟!换team,一个指令也干了十几分钟,但是token也干的太快了。吃不消。 image|654x285 3 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-26 15:28:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 12:41:17+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 12:18:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 11:41:17+08:00

阿维塔概念车 VISION XPECTRA 亚洲首秀,2030 年计划推出 17 款车型

IT之家 4 月 26 日消息,2026 北京车展期间,阿维塔科技携全系产品亮相。阿维塔首款概念车 VISION XPECTRA 迎来亚洲首秀,近期上市的新阿维塔 12、阿维塔 06T 同步亮相。 IT之家注意到,阿维塔科技董事长王辉在车展发布会上表示:“面向下一个五年,阿维塔将

tech www.ithome.com 2026-04-26 10:44:16+08:00

报~英伟达的DeepSeek V4 Pro 已经可用了~

早上试了一下,竟然有回复了,但是首字很慢,大概30S左右,前几句话吞吞吐吐的,后面的速度明显提升 5 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-26 10:02:22+08:00

不知不觉我竟然已经浏览了17530个帖子

没事就在L站看帖子,看最新的信息。生怕错过了价值一个亿的帖子 8 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-26 09:56:44+08:00

300块的cursor学生优惠值得买吗

300块的cursor学生优惠值得买吗 我看闲鱼上有类似的渠道呀 最近windsurf试用号经常出问题 想试试这个 2 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-26 09:10:37+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 04:14:49+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 04:14:49+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 04:14:49+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 04:14:49+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 04:07:34+08:00

OpenCode GO 已上线 deepseek v4

5 小时限额 pro 1300 次, flash 7450 次 理论上可以用于其他工具比如 claude code ,opencode 说 go 可以用于第三方。

tech www.v2ex.com 2026-04-26 03:14:49+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-26 03:07:34+08:00