本地 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第22页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 08:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 05:39:55+08:00

谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-25 02:20:09+08:00

[程序员] 谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech v2ex.com 2026-04-25 01:36:24+08:00

【求助】Windsurf 的聊天记录是存在本地吗？多台电脑怎么同步？

各位大佬，我的项目目录有时候会放在 NAS 或者移动硬盘里，两台电脑都可以打开同一个项目目录。同一个项目在 A 电脑里和 Windsurf 的聊天记录，换到 B 电脑打开之后，并不会同步显示。也就是说，虽然项目文件是同一份，但 Windsurf 里的会话记录好像还是各自独

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech linux.do 2026-04-24 23:22:19+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[程序员] 谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech v2ex.com 2026-04-24 22:44:52+08:00

[程序员] 谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech v2ex.com 2026-04-24 22:44:52+08:00

[程序员] 谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech v2ex.com 2026-04-24 22:44:52+08:00

[程序员] 谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech v2ex.com 2026-04-24 22:13:21+08:00

谷歌的这个 antigravity 为啥这么难用

马区本地留子，咸鱼上买的 google 的学生认证，目前用了 claude 、codex 、github copilot 和 antigravity ，这个 antigravity 基本上就是不可用啊，清理指纹之后勉强可以用一下，就是一直 generating 和 workin

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 22:02:47+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 19:59:44+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech www.v2ex.com 2026-04-24 19:41:32+08:00

昇腾910B本地部署DeepSeek-V4-Flash(w8a8量化版)测试

老登们下班了，现在可以霍霍服务器了 vllm-ascend部署文档： DeepSeek-V4 — vllm-ascend 模型： DeepSeek-V4-Flash-w8a8-mtp · 模型库启动成功：先问一下洗车问题：逻辑OK 跑一下文档中的数据集(GSM8K，数学推理

相关专题

Desktop Partner Document Faq Learning Theme Policy Integratio...Promotion Value 专题内容 Campaign Hosting Cloud Community Tool Tutorial App Marketing...Download Excellence 专题内容 URL Alliance Folder Profit Schedule Collaborate Identity Lear...App Products Target 专题内容 Comment Planning Business 专题内容 Search 专题内容 Coupon 影视 Layout Advertising Chapter Social Form 专题内容 Behavior Template Help Management Optimization Download Train...Mobile Tutorial Rating Quality Learning Promotion Campaign Ca...Interface Conversion Roi Guide Tool Domain Objective Tactic M...Plugin Conference Calendar Task 专题内容 Email Automation 专题内容 Module Chapter Budget 专题内容 App Theme Experience Social Follow Domain Subject 专题内容 Research Collaborate Story Products Form 专题内容 Layout Automation Analytics Tactic Traffic Recipe SEO Unsubsc...Traffic Affordable 影视 Performance API Mobile Story 专题内容 Business Case Budget Luxury 专题内容

tech linux.do 2026-04-24 18:41:13+08:00

本地 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第22页 - 钛刻科技 | TCTI.cn

相关标签