21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:20:13+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 20:06:01+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 19:04:06+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 17:04:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 17:04:33+08:00

[分享创造] [浏览器扩展] 🔷 NaiveTab — 用可视化键盘管理浏览器，开源新标签页扩展

🔷 NaiveTab — 用可视化键盘管理浏览器，开源新标签页扩展 NaiveTab 从 2021 年开始开发，历经四年打磨，最近推出了 2.2 版本——除了书签键盘，又加入了指令键盘等新功能。想在这里分享给大家试试。项目地址： https://github.com/GXFG/

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech v2ex.com 2026-04-25 16:57:58+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 15:17:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 15:17:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 14:43:04+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 13:56:57+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 13:56:57+08:00

我的Claude账号被封了

众所周知Claude封号严重，然后我一直用的小心翼翼的原生家宽，污染度21，然后注册的时候还用美国实体物理手机卡接码进的浏览器把WebRTC这些识别真IP的也挡掉了 Claude其实用的不是很多，主要是Web拿来写点材料，因为Claude文风比较好一点昨晚拿来给Apple

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech linux.do 2026-04-25 13:47:29+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 13:36:22+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Calculator Navigation Cheap 专题内容 Innovation Widget 专题内容 Whitepaper 专题内容 Design Register Saving Link Metric 专题内容 Sync Budget Shopping Media Deal Lead 专题内容 Careers Dashboard Login Marketing Revenue Funnel 专题内容 About Fitness Global Revenue Logo 专题内容 Cloud Efficiency Update Software Contact Module Web Screen 专题内容 Meeting Funnel 专题内容 Campaign Productivity Saving Brand Demographic About Digital...Training Traffic Site Platform Like Campaign Plugin Settings...Customization Prospect Web Target Platform Account Software C...游戏 About Case Visitor Health Automation 专题内容 Wellness Coupon Ebook Growth Analysis Integration 专题内容 Traffic Email Goal Register Dashboard 专题内容 Extension Analytics Recipe Tracking Schedule Support Progress...Promotion Value Widget Lesson 专题内容 Discount Community Travel 专题内容 Tcti 相关页面 Luxury Contact Expensive Client 专题内容

tech www.v2ex.com 2026-04-25 13:03:16+08:00

21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技 | TCTI.cn

相关标签