记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第11页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 21:45:41+08:00

佬友们推荐一下感觉必看的电影

好奇，万千佬友们心目中最值得看的电影都是什么，如果不介意方便把他们记录下来，我会收藏的 25 个帖子 - 20 位参与者阅读完整话题

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 21:39:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

codex不显示回话内容是为什么（公益站记录显示正常消耗）

codex不显示输出内容，但是在历史记录中可以正常使用是什么问题 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 20:23:23+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:20:13+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 20:06:01+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 19:04:06+08:00

Claude封号观察记录（目前第一天）

TB上弄了一个apple store 付款的Claude pro，为此换了一个纯净度几乎100的家宽梯子，心里十分忐忑，大老板给实验室每个人关于AI的支出报销额度是100，我已超出，不想亏太多，看能活多久，做一个记录。 9 个帖子 - 5 位参与者阅读完整话题

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 18:13:36+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 17:04:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 17:04:33+08:00

记录小白第一次vps+cpa

VPS 选用的是这位大佬的配置 Rabisu小鸡年付9.9刀乐（1核1内存，理论不限流量），不含Aff(始皇：主帖里就把内容写全。不然佬友们看着含含糊糊，不知道你是要分享还是推广) - 开发调优 - LINUX DO 选择的是美国洛杉矶，使用工商万事达卡支付费用是 10.49刀

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 15:17:21+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 15:17:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 15:17:18+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 14:43:04+08:00

GPT-5.5 配了 1M 却又显示 258K？Codex Desktop Windows 修复记录（无效）

我遇到的问题是： config.toml 里明明已经写了 GPT-5.5 的 1M 上下文，但 Codex Desktop 新开线程或重启后，界面又显示回 258K。最后排查发现，不是 config.toml 写错，而是 Codex Desktop 会读取本地模型缓存。缓存里的

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 13:59:11+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 13:56:57+08:00

记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第11页 - 钛刻科技 | TCTI.cn

相关标签