lm - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第24页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-25 01:40:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:47:32+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

问一下glm7天体验卡能用glm5吗？

问一下glm7天体验卡不能用glm5吗显示无法使用模型，我用Cherry Studio测了只有到4.7过… 是哪里配错了吗有佬知道吗 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech linux.do 2026-04-24 22:33:20+08:00

分享自己的智谱GLM Coding Plan体验卡【已领完】

新人报道，国产模型我主力使用智谱GLM，分享下官方送的体验卡，应该还有两次，回馈下佬友们。我在使用GLM Coding Plan，数小时内完成过去需要数周的开发工作，赠送你1张7天AI Coding体验卡，一起来用吧：智谱AI开放平台 2 个帖子 - 2 位参与者阅读完整话

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech linux.do 2026-04-24 21:59:06+08:00

realme 真我商城明起停止运营，业务全面整合至 OPPO 体系

IT之家 4 月 24 日消息，据 realme 真我商城官网公告，真我商城将于 4 月 25 日（明天）停止提供购物、商品内容浏览、用户反馈、活动参与、商品评价、帖子评论、观看视频与直播、积分服务，保留历史订单信息查询服务等。“真我商城”小程序也将同步下架。对于有查看历史订单

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech www.ithome.com 2026-04-24 21:50:19+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

为啥还有人在吹minimax-M2.7啊，说说我自己测试的感受

我在qclaw里用的，minimax-m2.7的倍率是0.7，kimi-k2.6的倍率是1.6，glm-5.1的倍率是2.5，然后我让qclaw绑定一下企业微信的机器人，结果m2.7给我聊了7~8轮，硬是指挥着我到处兜圈子，就是没搞定，然后换glm5.1，一次指令就绑定了，虽然因

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech linux.do 2026-04-24 21:27:24+08:00

我感觉deepseek-v4在故意气我，但是我没有证据

前情提要：分享一个利用LLM干逆向工程的神奇小妙招 - 开发调优 - LINUX DO 正常人都应该能从我prompt的隐含语义里得出我想要的 funcptr_name是 CCSPlayerController_XXXXXX这种有意义的函数名，并且我的Example: 里写的也

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech linux.do 2026-04-24 21:26:15+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

Nao佬的Deepseek V4 评测出来了国模第一!

flash版本也很能打 llm2014.github.io LLM Benchmark Dashboard 18 个帖子 - 16 位参与者阅读完整话题

相关专题

Success Policy Browser Podcast Calendar Goal 专题内容 Blog Health Lesson Social Communication Photo Entertainment 专题内容 Quality Podcast Team 专题内容 Training 专题内容 File Widget Conversion Partner Metric Local Community Cloud 专题内容 Cheap Price Growth Blog Strategy 专题内容 Excellence Review Landing Lesson Quality Discount Sport 专题内容 Enterprise Chapter Feedback Coupon Analytics Share Community...Security Register Form Conversion Growth Traffic 专题内容财经 Logo Supplier Discovery Automation Coupon 影视 Metric 专题内容 Efficiency 专题内容 Customization Prospect Investment Subscribe Logo About Notifi...Lesson 专题内容 Budget Roi Expense Change Project 专题内容 Seminar Optimization Website 专题内容 Template Progress Review Community Share Security Segment 专题内容 Kpi Ebook Template Behavior Meeting Analysis 专题内容 Landing Creative Budget Mobile Customer 专题内容 Food Objective Consulting Collaboration Hotel Keyword App 专题内容 Local 专题内容

tech linux.do 2026-04-24 20:26:07+08:00

lm - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第24页 - 钛刻科技 | TCTI.cn

相关标签