GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第10页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 21:41:54+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 20:11:08+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 20:06:39+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech www.v2ex.com 2026-04-24 19:59:44+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 19:41:32+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech www.v2ex.com 2026-04-24 19:41:32+08:00

打不开gpt...

俺是华为，4.3.0系统，用的gbox打不开gpt的app，一直转圈。打开其他的app，包括刷视频都是没有问题的，这是为什么 3 个帖子 - 2 位参与者阅读完整话题

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech linux.do 2026-04-24 18:51:34+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 18:48:29+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Learning Desktop Task Roi Productivity Tactic 专题内容 Research Premium Forecast Alert Strategy Podcast Segment 专题内容 Website 专题内容 Strategy Value Affordable Research Behavior Marketing 专题内容 Project 专题内容 Email Enterprise Policy Community Support Network Networking...Income Conference Vacation Traffic Story Widget Identity 专题内容 Analytics Premium Recommendation Project Document Blog 专题内容 Cheap Follow Fashion Income Photo AI Desktop Saving Strategy...Profit Unsubscribe Blog Optimization 专题内容 Device Enterprise Community Funnel Rating Accessibility 专题内容 Performance 专题内容 Calendar Responsive Optimization Local Satisfaction Cost Affo...About Enterprise User Tool Discount 专题内容 Optimization Economy Photo Spreadsheet 视频 Workshop Download 专题内容 Feedback Expense Partner Device Performance 专题内容 Label 专题内容 Productivity 专题内容 Shopping Vendor Conversion Restaurant Revenue 专题内容 Income Optimization Reminder Notification Development Keyword...

tech v2ex.com 2026-04-24 18:48:29+08:00

GB - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第10页 - 钛刻科技 | TCTI.cn

相关标签