技术 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第14页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 13:36:22+08:00

[推广] 昨天发了一篇牢骚消耗铜币，今天继续。今天想跟各位折腾 NAS 的老哥们聊个技术向的现实问题。

很多人觉得播放器只支持 SMB 协议在户外没法用，但实际上，只要配合 Tailscale 这样的虚拟局域网（异地组网）工具，你在户外一样能完美地串流家里的 NAS 数据。所以从本质上讲，Nas Player Pro 🍆 已经是一个完全独立的“全能 NAS 娱乐终端”了。当然，就

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 13:10:46+08:00

[推广] 昨天发了一篇牢骚消耗铜币，今天继续。今天想跟各位折腾 NAS 的老哥们聊个技术向的现实问题。

很多人觉得播放器只支持 SMB 协议在户外没法用，但实际上，只要配合 Tailscale 这样的虚拟局域网（异地组网）工具，你在户外一样能完美地串流家里的 NAS 数据。所以从本质上讲，Nas Player Pro 🍆 已经是一个完全独立的“全能 NAS 娱乐终端”了。当然，就

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 13:10:46+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 13:03:16+08:00

[推广] 昨天发了一篇牢骚消耗铜币，今天继续。今天想跟各位折腾 NAS 的老哥们聊个技术向的现实问题。

很多人觉得播放器只支持 SMB 协议在户外没法用，但实际上，只要配合 Tailscale 这样的虚拟局域网（异地组网）工具，你在户外一样能完美地串流家里的 NAS 数据。所以从本质上讲，Nas Player Pro 🍆 已经是一个完全独立的“全能 NAS 娱乐终端”了。当然，就

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 13:00:41+08:00

[分享创造] 昨天发了一篇牢骚消耗铜币，今天继续。今天想跟各位折腾 NAS 的老哥们聊个技术向的现实问题。

很多人觉得播放器只支持 SMB 协议在户外没法用，但实际上，只要配合 Tailscale 这样的虚拟局域网（异地组网）工具，你在户外一样能完美地串流家里的 NAS 数据。所以从本质上讲，Nas Player Pro 🍆 已经是一个完全独立的“全能 NAS 娱乐终端”了。当然，就

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 12:53:39+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 12:52:52+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 12:39:09+08:00

低价gpt代充的技术讨论

结合一些帖子，用豆包专家模式探讨低价gpt plus来源，佬友们评价一下是否合理，这么说的话伪造收据理论上可以嫖好多好多gpt plus了。只要有足够的需求，就会有相应的供给呀 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech linux.do 2026-04-25 12:22:58+08:00

[分享创造] 昨天发了一篇牢骚消耗铜币，今天继续。今天想跟各位折腾 NAS 的老哥们聊个技术向的现实问题。

很多人觉得播放器只支持 SMB 协议在户外没法用，但实际上，只要配合 Tailscale 这样的虚拟局域网（异地组网）工具，你在户外一样能完美地串流家里的 NAS 数据。所以从本质上讲，Nas Player Pro 🍆 已经是一个完全独立的“全能 NAS 娱乐终端”了。当然，就

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 12:15:46+08:00

标致将采用东风技术在华生产新车：明年问世，还会出口海外

IT之家 4 月 25 日消息，据路透社报道，标致将使用长期合作伙伴东风的技术，在中国生产新车型。按照标致周五公布的计划，这些车不仅会供应中国市场，也会从中国出口到海外市场。标致高调重返北京国际车展，并带来了两款全新概念车。对母公司 Stellantis 来说，这也意味着在经历

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.ithome.com 2026-04-25 10:18:50+08:00

LINUXDO什么时候能搞一个技术交流会？

网站天天活跃度那么高，搞一场线下技术交流会大家觉得有必要吗？ 9 个帖子 - 7 位参与者阅读完整话题

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech linux.do 2026-04-25 09:30:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 08:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech www.v2ex.com 2026-04-25 05:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Technology Discount Network Strategy Tutorial Objective Conve...Communication Cloud Extension Deal Presentation Success 专题内容 About 专题内容 Calendar Wellness Unsubscribe Automation Project Settings Not...Planning Module Email Device Customer Extension 专题内容 Beauty SEO Folder Share Health Excellence Section Project Lik...Integration Quality Responsive Innovation Desktop Device 专题内容 Sales Mobile Fashion 专题内容 Integration Cloud Analytics Segment Calculator 游戏专题内容 Success Expense Traffic Conversion Expensive Site Research Up...Device Vacation Section Schedule Accessibility Machine Health...Partner Hosting Expense Community Follow 专题内容 Template Share 专题内容 Behavior Team Premium Luxury Lead 专题内容 Social Partner 专题内容 Event Segment Brand 专题内容 Value 专题内容 Case 视频 Domain Innovation Whitepaper Recommendation Cloud 专题内容 Version Event Comment Investment Security Ranking Quality Sub...Webinar Folder Communication Task Cloud 专题内容

tech v2ex.com 2026-04-25 03:39:55+08:00

技术 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第14页 - 钛刻科技 | TCTI.cn

相关标签