记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第12页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 13:56:57+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 13:36:22+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 13:03:16+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 12:52:52+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 12:39:09+08:00

GCP 300刀赠金快到期了，在vertex ai配置gemini踩坑记录

（话题已被作者删除） 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 12:34:35+08:00

mimo的token plan怀疑存在bug，Credits多算额度

昨天记录了一下用量，今天使用来生成看看用量，但是按照官网的说法 1token = 1 Credits ,不应该会用那么多Credits ，还是说有其他算法？ 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 11:47:45+08:00

用了半年多的Claude被封了

今天收到邮件，Claude被封了，记录一下… –关于账号，看了下记录，是2025-06申请的账号，用的是接近20年的老gmail。 –关于订阅，4个月之前用美区apple store开了pro订阅，这一期还没结束 –关于ip，一直用的飞鸟机场，4月初机场出事后开始dmit拼车，然

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 09:38:27+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 08:39:55+08:00

尼区claude pro，4.24订阅记录贴，看坚持几天

先说一下环境：物理坐标国内，美区apple id老号转区到尼区，闲鱼礼品卡充值订阅，订阅时美国家宽节点+时区语言地区全部改成美国美区google老账号登录claude，之前从来没登录过，claude账号应该算新的。家里和公司两台电脑，均是在自己搭的日本aws中继+落地美国家

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech linux.do 2026-04-25 07:32:17+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech www.v2ex.com 2026-04-25 05:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech v2ex.com 2026-04-25 02:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Image 专题内容 Notification Client Help Optimization Integration Experience...Local Comment 专题内容 Database Task Blog Integration Update Reminder Button Target...财经 Training Technology Wellness Lesson Data SEO Brand 专题内容 AI Responsive Task SEO Sale Desktop 专题内容 Study Screen 专题内容 Account 专题内容 Optimization Accessibility Automation Screen Economy Contact...Partner Mobile 专题内容 Travel Client Conversion Analytics Screen Partner Mobile Trac...Cloud Learning Experience Training Cheap Support 专题内容 Login Contact Reminder Theme Subscribe Analysis AI Team 专题内容 Course Goal AI Restore 专题内容 Prospect Restaurant Marketing Client 专题内容 Presentation Like Budget Image Planning Management Label Bran...Support 专题内容 Register Help Online Development 专题内容 Brand Deadline Widget Calendar 专题内容 Dashboard Rating Management Database Account Training Enterta...

tech v2ex.com 2026-04-25 02:18:07+08:00

记录 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第12页 - 钛刻科技 | TCTI.cn

相关标签