21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第6页 - 钛刻科技

[55分]0刀卡有需要额自取

送一张刚开的0刀卡，时效一小时 5317900657202394 2031 04 820 211 South 9th Street, San Jose, California 95112, United States, San Jose, California 95112, Un

相关专题

tech linux.do 2026-04-26 16:15:42+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 12:41:17+08:00

分享一个minimax plus的token plan

sk-cp-zAhhrL76V16K0ae6w3dY76VZVAP62Tlh_-S_xb3UNt3m9yeoKhlvBrumIxowUZCzI_NySjgH9IrIYT8cueci1unqDKMt0Cweu13wUw9QuJyEcBRQfI-rm6o 2026.5.21到期，主要

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech linux.do 2026-04-26 12:05:25+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 11:41:17+08:00

售价 18.99 万元起，212 越野车 T01 METTA 上市

IT之家 4 月 26 日消息，在 2026 北京国际汽车展览会上，212 越野车以“壮阔世界 ·METTA 之境”为主题，正式推出旗下首个越野生态系列 ——METTA，并全球首发两款全新车型。其中，T01 METTA 官方指导价为 18.99 万元，T01 METTA 巴丹吉林

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.ithome.com 2026-04-26 09:49:09+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 03:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 02:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 01:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第6页 - 钛刻科技 | TCTI.cn

相关标签