GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 12:39:09+08:00

【开源自荐】ConfigBox：服务器上的Claude Code & Codex配置可视化切换工具

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech linux.do 2026-04-25 12:25:46+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 08:39:55+08:00

IT早报 0425：曝苹果 iPhone 18 标准版配 12GB 内存；2026 北京车展开幕；DeepSeek-V4 预览版正式发布；OpenAI 发布 GPT5.5...

“IT早报”时间，大家好，现在是 2026 年 4 月 25 日星期六，今天的重要科技资讯有： 1、提升 50%，消息称苹果 iPhone 18 标准版配 12GB 内存半导体产业分析师 Dan Nystedt 4 月 24 日在 X 平台发布推文，指出苹果 iPhone 18

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.ithome.com 2026-04-25 07:29:34+08:00

提升 50%，消息称苹果 iPhone 18 标准版配 12GB 内存

IT之家 4 月 25 日消息，半导体产业分析师 Dan Nystedt 昨日（4 月 24 日）在 X 平台发布推文，指出苹果 iPhone 18 标准版（预估延后至 2027 年发布）将配备 12GB 内存，较 iPhone 17（8GB 内存）提升 50%。消息称苹果

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.ithome.com 2026-04-25 06:47:54+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech www.v2ex.com 2026-04-25 05:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 02:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 02:18:07+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-25 01:40:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Faq Careers Company Conversion Plugin Collaboration Meeting O...Management Quality Section Advertising 专题内容 Training Support Security Machine 专题内容 Button 视频 App 专题内容 Contact Roi 专题内容 Policy Hotel Course Tutorial 专题内容 URL 专题内容 Demographic 专题内容 Browser Form Supplier Guide 游戏 Value Hosting Objective Unsubs...Demographic Global Restaurant 专题内容 Engagement Networking Expensive Software System Income Revenu...Analytics Integration Whitepaper Help Technology Innovation T...Networking Course Report Premium Notification Demographic 专题内容 Satisfaction Growth Label Global Tool Plugin About Music Cons...Company Roi Community Webinar Email Optimization 专题内容 Plugin Presentation Guide Development Roi Prospect Like 专题内容 Project Upload Audience Lead Email Cloud Screen Platform Care...Dashboard 专题内容 User Community 专题内容 Networking Comment Digital Calculator Tutorial Module Deadlin...

tech v2ex.com 2026-04-24 23:47:32+08:00

GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技 | TCTI.cn

相关标签