30 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第40页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 22:41:38+08:00

vivo X300 FE 手机现身海外：骁龙 8 Gen 5 芯片、6.31 英寸 OLED 屏幕，6500mAh 电池

IT之家 4 月 24 日消息，vivo 官方今天在奥地利市场公布了 X300 FE 手机的预热信息，新机将搭载骁龙 8 Gen 5 芯片、 6.31 英寸 AMOLED 屏幕，4 月 29 日正式发售。据介绍，这款手机定位“小屏旗舰”，机身厚度 8.2mm，重量 192g，

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech www.ithome.com 2026-04-24 22:03:29+08:00

【抽奖】5个50刀Codex额度包

抽奖主题：五个50刀Codex额度，纯血号池（可用5.5模型）,时限楼层到达300层。奖品详情： [奖品1]：50刀Codex额度 [奖品2]：50刀Codex额度 [奖品3]：50刀Codex额度 [奖品4]：50刀Codex额度 [奖品5]：50刀Codex额度活动时间：

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech linux.do 2026-04-24 21:51:09+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 21:41:54+08:00

有点牛逼啊，gpt-5.5价格翻倍但实际用下来差不多量

如图，差不多一样的量，5.4输出了1.几M，5.5只输出了300k多，价格差不多。但是我用的中转站好慢啊，怎么只有10-20token/s，大家用5.5都是什么速度啊 6 个帖子 - 4 位参与者阅读完整话题

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech linux.do 2026-04-24 20:57:25+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech www.v2ex.com 2026-04-24 20:35:40+08:00

高铁将试点坐火车可以带自行车骑行爱好者通过12306客户端办理

针对旅客日益多样化的出行需求，铁路部门正在不断优化个性化服务。自5月19日起，京张高铁将在北京北至崇礼站区间试点自行车随身行服务。这意味着骑行爱好者可以带着心爱的单车，直接搭乘高铁前往目的地。旅客只需通过12306客户端即可在线完成预约和付费。为了确保行车安全与车厢秩序，携带

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech plink.anyfeeder.com 2026-04-24 20:35:24+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 20:11:08+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech v2ex.com 2026-04-24 20:06:39+08:00

和异性的聊天记录

之前在网上认识了个女生，现在已经分手了。当我又翻到这段聊天记录，感觉她说的前两句话对我的伤害挺大的。 30 个帖子 - 26 位参与者阅读完整话题

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech linux.do 2026-04-24 20:02:28+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

财经 User Resolution Seminar Rating Link Accessibility Reportin...Reminder 专题内容 Like Partner Download Template Progress System Domain Economy...Dashboard Management Settings Trading Music Site Workshop 专题内容 Identity Report Performance Loyalty Mobile Calendar Photo Edu...Blog Login Message Customization Trading Recipe 专题内容 Conversion Vendor Dashboard Saving Price Budget 专题内容 Visitor Forum User Value Advertising 影视 Form 专题内容 Profile Marketing Story Goal Investment Global Feedback Colla...Link 专题内容 Alert Collaboration Revenue Investment Tutorial Optimization...Whitepaper Analysis User Conversion About Document 专题内容 Study Business Photo Customer Wellness Identity Conference Ho...Download Profit Optimization Supplier 专题内容 Hosting Supplier Change Vacation 专题内容 Report API Download Project Budget Integration Client 专题内容 Webinar Services Marketing Promotion App Responsive 专题内容 Cheap Design Planning Image Collaboration Success Trading Sto...Internet Luxury Partner Machine Calendar Upload Behavior 专题内容 Network Training Research Fashion Screen Segment Milestone Sa...

tech www.v2ex.com 2026-04-24 19:59:44+08:00

30 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第40页 - 钛刻科技 | TCTI.cn

相关标签