一下 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第66页 - 钛刻科技 | TCTI.cn

一下 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第66页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 2186 篇相关文章 · 第 66 / 110 页

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 22:48:43+08:00

收集一下佬们现在还在用的codex是什么

收集一下佬们现在还在用的codex是什么,集思广益,探索更低价的优秀方案~ 3 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-24 22:48:29+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 22:41:38+08:00

问一下glm7天体验卡能用glm5吗?

问一下glm7天体验卡不能用glm5吗 显示无法使用模型,我用Cherry Studio测了只有到4.7过… 是哪里配错了吗有佬知道吗 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 22:33:20+08:00

人怎么能活得这么失败

人怎么能活得那么失败? 心里难受的要死,我心想我玩一玩西奥小镇吧,建设一下我的城市 结果有一段线路怎么都建不好,我想把那个桥上面的路引到地面上来,结果怎么都引不下来 就在这个小问题上面卡了大约1小时,不断地试反复的试 还是弄不好 “我真操你妈了。”我突然怒吼出声,猛戳手机屏幕。

tech linux.do 2026-04-24 22:27:57+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 21:41:54+08:00

问一下佬们,周限是每七天自动刷新还是每周一刷新啊

我这个cpa这个周限额是每七天刷新一回是以这个为准吗 9 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-04-24 21:36:43+08:00

[分享发现] AI 辅助英语学习,无推广,讨论一下

Vibe Coding 了一个 App ,主要功能是,搜索数据库中的字幕,返回字幕结果,点击结果可以从字幕所在的地方开始播放视频。 我的学习流程是:下载影视资源 → 下载字幕 → 找 Gemini 翻译成双语字幕(机翻偏向直译容易理解) → 找 Gemini 分析并找出短语搭配和

tech v2ex.com 2026-04-24 21:29:54+08:00

[分享发现] AI 辅助英语学习,无推广,讨论一下

Vibe Coding 了一个 App ,主要功能是,搜索数据库中的字幕,返回字幕结果,点击结果可以从字幕所在的地方开始播放视频。 我的学习流程是:下载影视资源 → 下载字幕 → 找 Gemini 翻译成双语字幕(机翻偏向直译容易理解) → 找 Gemini 分析并找出短语搭配和

tech v2ex.com 2026-04-24 21:29:54+08:00

[分享发现] AI 辅助英语学习,无推广,讨论一下

Vibe Coding 了一个 App ,主要功能是,搜索数据库中的字幕,返回字幕结果,点击结果可以从字幕所在的地方开始播放视频。 我的学习流程是:下载影视资源 → 下载字幕 → 找 Gemini 翻译成双语字幕(机翻偏向直译容易理解) → 找 Gemini 分析并找出短语搭配和

tech v2ex.com 2026-04-24 21:29:54+08:00

ai想论文创新点怎么样

最近打算弄一篇sci四区的论文 用ai来想创新点效果怎么样呢?想出来的idea能发表一篇嘛 问一下各位佬 5 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-24 21:28:37+08:00

想自己搭建一个小鸡

大家好!我想自己搭建一个小鸡,刚入行,有没有大佬可以教我一下?鄙人不胜感激 2 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-24 21:26:28+08:00

现在有佬在肇庆的某个科创比赛现场吗?

现在有佬在肇庆的某个科创比赛现场吗?可以认识一下 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 21:16:45+08:00

[分享发现] AI 辅助英语学习,无推广,讨论一下

Vibe Coding 了一个 App ,主要功能是,搜索数据库中的字幕,返回字幕结果,点击结果可以从字幕所在的地方开始播放视频。 我的学习流程是:下载影视资源 → 下载字幕 → 找 Gemini 翻译成双语字幕(机翻偏向直译容易理解) → 找 Gemini 分析并找出短语搭配和

tech v2ex.com 2026-04-24 21:12:31+08:00

[DeepSeek] DeepSeek 4 好贵啊,比 3.2 贵 12 倍。。。

DeepSeek 4 上了,说是用来编程的,但是这个价格。。。 有没有富哥来分享一下体验感? https://imgur.com/a/z62cUo0

tech v2ex.com 2026-04-24 20:44:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现

最近在折腾本地大模型,发现一个核心问题:Ollama 和 LM Studio 能让模型跑起来,但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。 于是做了个工具自动找最优配置,过程中踩了不少坑,记录一

tech v2ex.com 2026-04-24 20:35:40+08:00