折腾 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技

最近自己折腾了一台物理机，搭了个自建中转池子。

目前把 GPT-5.5 给接通了，自己测了测感觉还行。既然折腾好了，拿出来给大家抽个奖，送点额度随便跑跑。注意事项：纯个人折腾的池子为了遵守版规不带任何推广嫌疑，本帖不放任何站点链接。中奖的佬友，我会通过论坛私信兑换码发给你。奖品详情：价值 65刀gpt5.5额度

相关专题

tech linux.do 2026-04-27 01:01:01+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 20:09:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 20:09:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 13:41:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 12:41:17+08:00

有人折腾过Wayland的机器上装Rustdesk吗？

我在pve里面有台debian机器，我在上面装了Rustdesk之后发现连接的时候每次Wayland都需要选择显示器。。。最后即使当我给它设置Clear掉Wayland选择，让它自动选择（唯一的显示器），过了一阵子之后又卡在被控端选择显示器上了。我真的是服了。除了换X11以外还

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech linux.do 2026-04-26 12:12:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 11:41:17+08:00

对新出的几个模型需求完善程度比拼 - 网络篇

无聊的时候对一些新出的模型提了一个很久之前困扰我网络折腾上的难题。题目如下：我有一个需求，就是通过有公网IPv4的服务器+wireguard VPN将NAT里面服务器的端口暴露出去，并且能够让NAT服务器的服务能看得到请求客户端原始的IP，并且没有Proxy Protocol

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech linux.do 2026-04-26 10:48:01+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 03:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 02:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 01:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Case Device Account Community 专题内容 Reporting Presentation Navigation Metric Wellness Seminar Des...Design 专题内容 Event Register Subject Profile Calendar Mobile 专题内容 Collaboration Lead Template Cost Roi Document 专题内容 Efficiency Local Keyword Project Expensive Landing 专题内容 Settings Login Desktop Price Report Demographic 专题内容 Education Music Analytics Supplier Discovery Search Optimizat...Cheap Podcast Solution Platform Section Unsubscribe Training...Support Wellness Subject Achievement Section Team Innovation...Widget Networking Logo Domain Website Communication Course Re...Audience Planning 专题内容 Event 财经 Economy Careers Server Tactic Fitness Guide 专题内容 Tcti 相关页面 Extension Sport Software 专题内容 Comment Digital Optimization 专题内容 Mobile Training Navigation Meeting Strategy Education Chapter...Audience Accessibility Discovery Register Customer 专题内容 Follow Kpi Collaborate 专题内容 Health Growth Target Support 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

折腾 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn

相关标签