一下 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第64页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech www.v2ex.com 2026-04-25 06:39:55+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech www.v2ex.com 2026-04-25 05:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 03:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 03:39:55+08:00

浅谈吐槽一下目前发现的gpt5.5新审查机制

新审查是类似gemini的外审但gpt5.5外审在正经工作的时候现在都是敏感肌且频繁触发会导致该账号使用gpt5.5时的tps大幅降低疑似为高风险账号导致遭到云端多次审查才会给你这次请求放行也可能是强制路由到其他本来就慢模型 gpt5.5本身tps很快一风控就特别明显

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-25 02:56:17+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 02:39:55+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 02:18:07+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-25 01:40:43+08:00

deepseek-v4-flash + Harness 实践

【长期贴】开个帖子，分享一下我自己是如何做harness【已更新完成，等待交作业，后续再有新想法再补充】开发调优据网上传，目前Anthropic的所有产品均为harness模式，不过最近他们推了一个harness产品，原本把我吓了一跳，但实质一看，并不是干货，多少有点恶心人了

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-25 00:48:23+08:00

定投小实验，普通人の养老金攻略？

分享一下最近开始做的一个小实验，因为一直有朋友问我到底怎么投资，而我不想把人盲目的引进股市，于是想要推荐定投，但又想到我自己也从来没尝试过DCA，仅仅是通过回测和他人的分享就进行推荐同样是一种盲目，所以我决定掏出真金白银来进行试验，挑选几种简单的方式，流派全都测一遍。境内组出于

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-25 00:38:03+08:00

想问一下佬友们关于视频制作的问题

想问问推上nous research现在正在置顶的那个视频是怎么制作的？（贴链接的话好像需要审核才能发出来，麻烦佬友手动搜一下） 2 个帖子 - 2 位参与者阅读完整话题

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-25 00:18:50+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-24 23:54:14+08:00

何时能归温柔乡

停药了，不吃草酸艾斯西酞普兰了等能活到哪一秒算哪一秒吧多多发帖子记录一下，除此之外没别的可做的 15 个帖子 - 7 位参与者阅读完整话题

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-24 23:53:00+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech v2ex.com 2026-04-24 23:47:32+08:00

Grok 最近一直抽风，想问一下各位的情况

这几天天天就这状态，有没有佬能正常用网页普号，哪里IP？ 4 个帖子 - 4 位参与者阅读完整话题

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-24 23:42:47+08:00

gpt5.5好贵啊，我敲！

这随便蹬一下，100多刀没了。还没有开fast模式。牛逼是真牛逼。感觉一天要是2-3任务并行，起码需要300刀？ 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Webinar Study Behavior Quality Event 财经 Tactic Growth 专题内容 Accessibility Premium Community 专题内容 Lead Coupon Strategy Tutorial 专题内容 Seminar Schedule Retention Innovation 专题内容 Platform Dashboard Study Interface Sport Calendar 专题内容 Notification Tool Profile Lead Tactic Value Identity Analysis...Account Dashboard Online Affordable Data Search 视频专题内容 Photo Training Course Demographic Seminar Quality File Email...Task Widget Campaign Browser Team 专题内容 Document Strategy Entertainment Faq 专题内容 Alliance Media Productivity Task Local Screen Loyalty 专题内容 Online Products Like Productivity 专题内容 Integration 专题内容 Travel Innovation Case Calendar System Server Contact 专题内容 Food Machine 专题内容 Data Search Market Achievement 专题内容 Theme Tracking Campaign Client Reminder Tool Investment 专题内容 Network Premium Accessibility Machine Resolution Guide Techno...视频 Logo 专题内容 Audience Recommendation Discount Device 专题内容

tech linux.do 2026-04-24 23:21:31+08:00

一下 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第64页 - 钛刻科技 | TCTI.cn

相关标签