折腾 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-25 02:18:07+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-25 01:40:43+08:00

ChatGPT网页版号池

打算给老婆大人弄点GPT Plus用。不过她非常讨厌折腾，如果一个月换一次账户，她肯定不干。有什么办法建一个chatgpt的反代之类的，背后我弄个号池。对她来说就是完全透明的，和chatgpt官网一样。我知道有不少项目用api自己实现页面对话功能（LobeChat之类的），但

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech linux.do 2026-04-25 00:17:41+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:47:32+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 23:03:46+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 21:41:54+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Optimization 游戏 Deal Network Marketing Email Internet Automat...Ranking Saving Update Customer Meeting Target Rating 专题内容 Tool Partner Management Engagement Demographic Brand 专题内容 Whitepaper Segment Quality Tracking Server Feedback Section V...财经 Investment Online 专题内容 Chapter Data Quality Achievement Seminar Budget 专题内容 Quality Reminder Software Search Productivity Sport Contact T...Plugin Folder Conversion Restore Strategy Sales Course Analyt...Efficiency 专题内容 Logo Report 视频 Theme 专题内容 Comment Loyalty 专题内容 Planning Tracking Tool Demographic Meeting 专题内容 Company Consulting Local Meeting Help Automation Discount 专题内容 Networking Audience Brand Form Revenue Entertainment Customer...Marketing Entertainment 专题内容 Report AI 专题内容 Learning URL 专题内容 Objective 专题内容 Resource Webinar Hosting Server Forum Supplier Keyword Premiu...Budget Profit Vendor Planning API Value Optimization Entertai...

tech v2ex.com 2026-04-24 20:11:08+08:00

折腾 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技 | TCTI.cn

相关标签