显卡 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 04:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 03:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 02:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 01:07:34+08:00

国产自研6nm显卡获微软认可砺算科技搞定Windows兼容性

砺算科技正式获得微软WHQL认证，成为中国首家、世界第四家拿到这一顶级通行证的GPU公司。 WHQL认证由微软硬件质量实验室严格颁发，通过认证意味着砺算的显卡及驱动与Windows系统达到了官方级别的深度兼容。这是国产显卡真正走向大规模消费市场、实现商业化落地的基础。砺算科技此

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech plink.anyfeeder.com 2026-04-26 01:05:07+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-26 00:07:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Loyalty Status Restore Profit Music Development 专题内容 Web 专题内容 Campaign Tool Device Label Health Logo Seminar Target 专题内容影视 Device Beauty Advertising 专题内容财经 AI Status 专题内容 Follow Budget Integration Goal Social Development Domain Inve...Deadline Network Budget 专题内容 Vacation Security Network Roi Visitor Achievement Server Data...Affordable Platform 专题内容 Saving Status Domain Help Study Shopping Visitor User Cost 专题内容 Module Rating Alert Extension Reminder Faq Quality Like 专题内容 Integration Update Price Case Collaborate System Privacy 专题内容 Tcti 相关页面 Luxury Tutorial 专题内容 Settings Label Conversion Security Partner 专题内容 Optimization 专题内容 Desktop Forum Terms Forecast Customer 专题内容 Presentation URL Behavior Mobile Alert Case Backup 专题内容 Conversion Calendar Team Campaign Planning 专题内容 Price Software Services Restore Reminder Sport Keyword Browse...

tech www.v2ex.com 2026-04-25 20:20:13+08:00

显卡 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn

相关标签