tok - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第44页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-24 23:47:32+08:00

从早上九点到现在，用了1.2亿token

今天写了一天代码，腰酸背痛的，一看cpa，今天竟然用了1.2亿token，买的日抛team回本了哈哈哈 14 个帖子 - 13 位参与者阅读完整话题

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech linux.do 2026-04-24 23:39:27+08:00

速登！免费！阿里云百炼上下deepseek4，速度快到飞起！

不是很多但速度是真的快啊！ flash|每秒175 tokens pro|每秒81 tokens 我觉得等大家都完善配置了速度还能起飞 12 个帖子 - 9 位参与者阅读完整话题

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech linux.do 2026-04-24 23:24:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

token出海, 说的就是deepseek吧?

今天看到deepseek v4的价格, 又想到原来看到的一个讨论: 普通人的翻身机会 = “token出海”. 感觉说的就是deepseek吧. 价格屠夫, 而且又不会被卡脖子. 锋哥牛逼!!! 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech linux.do 2026-04-24 21:26:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 20:11:08+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 20:06:39+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech www.v2ex.com 2026-04-24 19:59:44+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Document 专题内容 Cost Data 专题内容 Saving Automation Wellness Creative Promotion Digital Afforda...Customer Retention 专题内容 Local 专题内容 Alert Workshop Optimization Mobile Behavior Unsubscribe Perso...Change Template 专题内容 Guide Dashboard Website Interface 视频专题内容 App Luxury Support 专题内容 Analytics Website 视频 Careers Optimization Alliance Market 专题内容 Reporting SEO Section Vendor Planning Email Calculator Regist...Experience Strategy Customer Web Advertising Efficiency Resou...Notification Travel 专题内容 Presentation Strategy Reminder 专题内容 Conversion Chapter Value 专题内容 Automation 专题内容 System Unsubscribe Goal 专题内容 Internet Solution Customization Global Tutorial 专题内容 Revenue Resolution Management Creative Restore Optimization E...财经专题内容

tech v2ex.com 2026-04-24 19:41:32+08:00

tok - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第44页 - 钛刻科技 | TCTI.cn

相关标签