记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第13页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-25 01:40:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

何时能归温柔乡

停药了，不吃草酸艾斯西酞普兰了等能活到哪一秒算哪一秒吧多多发帖子记录一下，除此之外没别的可做的 15 个帖子 - 7 位参与者阅读完整话题

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech linux.do 2026-04-24 23:53:00+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:47:32+08:00

【求助】Windsurf 的聊天记录是存在本地吗？多台电脑怎么同步？

各位大佬，我的项目目录有时候会放在 NAS 或者移动硬盘里，两台电脑都可以打开同一个项目目录。同一个项目在 A 电脑里和 Windsurf 的聊天记录，换到 B 电脑打开之后，并不会同步显示。也就是说，虽然项目文件是同一份，但 Windsurf 里的会话记录好像还是各自独

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech linux.do 2026-04-24 23:22:19+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Workshop Review Customer Lesson Calendar Integration Fitness...Integration Discount Message Online Privacy 专题内容 Form Dashboard Forum Message Deadline Project 专题内容 Price Vacation Network Budget Story Community 专题内容 Calculator 专题内容 Tactic Client Technology Theme Report 专题内容 Affordable 专题内容 Lesson Deal Tracking Trading Planning Objective Integration I...Services Strategy 专题内容 Strategy Technology Media 专题内容 Tactic Development Learning Meeting Funnel Efficiency Help Co...Keyword Version Analytics Income Supplier 影视 Email 专题内容 Customer Interface Excellence Calendar System Market 专题内容 Chapter Campaign Forecast Review Investment 专题内容 Automation 专题内容 Case Supplier 专题内容 Landing 专题内容 Button Subject Unsubscribe Schedule Navigation Segment Budget...Behavior 专题内容 Document 专题内容

tech v2ex.com 2026-04-24 20:11:08+08:00

记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第13页 - 钛刻科技 | TCTI.cn

相关标签