GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 12:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 11:41:17+08:00

VM8933 1835ZYC CHINA THGBMDG5D1LBAIL盒子怎么刷机

VM8933 1835ZYC ：这是主板板号 / 主控方案代号（晶晨 Amlogic 方案，常见于移动 / 联通 / 电信 IPTV 机顶盒，比如 CM201、UNT400、B860 系列） THGBMDG5D1LBAIL ：东芝 / 铠侠 4GB eMMC 闪存芯片（存储

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech linux.do 2026-04-26 09:32:19+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 03:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 02:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 01:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Saving Ranking Alliance Mobile Web Reporting 专题内容 Global 专题内容 Conversion Backup Premium Presentation Blog 专题内容 Optimization 财经专题内容 Objective Hotel 专题内容 Satisfaction URL Client 影视 Photo Income Vacation 专题内容 Growth Plugin Forum Account Marketing Personalization Metric...Version Server Saving Desktop Navigation 专题内容 Register Expensive Investment Analysis Integration Subject To...Podcast Navigation Blog Training 专题内容 Advertising Experience 专题内容 Version Design Brand Keyword Client Premium Online Segment Fo...Funnel Section Success Customization Travel 专题内容 Quality Success System Partner Desktop Blog 专题内容 Solution Excellence Reminder Hosting Machine 专题内容 Coupon URL Link Price Image 专题内容 Link Premium Loyalty Recommendation Client Event 专题内容影视 Search Automation Forecast Success Investment 专题内容 Software Saving Education Performance Screen Faq Guide 专题内容 Restore Products Resource Objective Brand 专题内容

tech www.v2ex.com 2026-04-25 21:45:41+08:00

GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技 | TCTI.cn

相关标签