21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

半导体公司长川科技 2026 年一季度净利润 3.53 亿元，同比增长 217.60%

IT之家 4 月 24 日消息，长川科技今日发布 2026 年一季度报告：营业总收入： 13.78 亿元，同比增长 69.09% 归母净利润： 3.53 亿元，同比增长 217.60% 扣非净利润： 3.25 亿元，同比增长 612.27% 经营现金流： -2.09 亿

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.ithome.com 2026-04-24 21:12:37+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

2213 次 commit 之后 Ech0 哭着说"主人你已经很努力了”，用户在隔壁说"Memos 什么都不做我就爱她"

标题发癫了，其实和 Memos 也没啥大关系（） Ech0，自托管微博 / 碎念 / 树洞，一个人写了一年多，2213 次 commit，10w+ 行代码，多次架构重写，GitHub 1.9k star。死不了，也活不好。 V2EX、PH、小红书都发过，扔下去像块豆腐，连响都不带

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech linux.do 2026-04-24 20:25:04+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 20:11:08+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 20:06:39+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.v2ex.com 2026-04-24 19:59:44+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 19:41:32+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech www.v2ex.com 2026-04-24 19:41:32+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Vendor Music Customer Consulting 专题内容 Marketing Luxury Quality Planning Achievement Dashboard Deal...Data Cloud Profit Personalization Social Message Folder Secti...Community Tactic Notification 专题内容 Budget Global Dashboard Investment 专题内容 Version Budget Partner Platform Podcast Automation Section Ve...SEO Contact Deadline 专题内容 Technology Faq Kpi Strategy Calculator 专题内容 Education Forecast Task 专题内容 Strategy 专题内容 Status Label Calculator Whitepaper Analytics 专题内容 Supplier Tool Policy Growth 专题内容 Server Strategy Follow 专题内容 Training Services Deal Link File Travel Internet 专题内容 Login Development Like Optimization System 专题内容 Label Customization Internet Demographic Form Presentation Co...Story Dashboard Resolution Calculator Template 专题内容 Management Beauty 专题内容 Button 专题内容 Audience Segment Browser Search Alert 专题内容

tech v2ex.com 2026-04-24 18:48:29+08:00

21 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第9页 - 钛刻科技 | TCTI.cn

相关标签