ok - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第61页 - 钛刻科技

Grok 最近一直抽风，想问一下各位的情况

这几天天天就这状态，有没有佬能正常用网页普号，哪里IP？ 4 个帖子 - 4 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 23:42:47+08:00

从早上九点到现在，用了1.2亿token

今天写了一天代码，腰酸背痛的，一看cpa，今天竟然用了1.2亿token，买的日抛team回本了哈哈哈 14 个帖子 - 13 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 23:39:27+08:00

速登！免费！阿里云百炼上下deepseek4，速度快到飞起！

不是很多但速度是真的快啊！ flash|每秒175 tokens pro|每秒81 tokens 我觉得等大家都完善配置了速度还能起飞 12 个帖子 - 9 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 23:24:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 23:03:46+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 22:48:43+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech www.v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

有哪些适合放在mac上使用的键盘

平时连接外屏还是想把自己mac当做主屏使用想找一把适合放在macbook键盘上面的能卡住的 NuPhy这个也太贵了求问大家有没有比他便宜一点的比较合适的 4 个帖子 - 3 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 22:05:28+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

token出海, 说的就是deepseek吧?

今天看到deepseek v4的价格, 又想到原来看到的一个讨论: 普通人的翻身机会 = “token出海”. 感觉说的就是deepseek吧. 价格屠夫, 而且又不会被卡脖子. 锋哥牛逼!!! 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 21:26:55+08:00

有没有佬用上grok的cli和bulid app，应该是开始灰度推送了，但是grok让我在grok网页跟x上反复横跳要安装包，也没有给

1 个帖子 - 1 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 21:07:57+08:00

MacBook 去掉刘海？苹果全新笔记本专利曝光，摄像头可拆卸、屏幕支持旋转

IT之家 4 月 24 日消息，据科技媒体 Android Headlines 今天报道，苹果最近申请专利《便携式电子设备的摄像头集成》，展示可拆卸摄像头、旋转显示屏的笔记本电脑概念。 IT之家了解到，苹果从 2021 年末起逐步为旗下 MacBook 产品线更新“刘海屏”，

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech www.ithome.com 2026-04-24 20:58:29+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech www.v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

supergrok换绑会容易掉吗，刚知道能换就换了，然后群友说容易掉，有没有佬知道的有点害怕

从hotmail换成gmail了 15 个帖子 - 4 位参与者阅读完整话题

相关专题

Tool Innovation 专题内容 Login Segment Advertising Brand Conversion Theme Beauty Alert...Food Follow Email 视频 Alert 专题内容 Resolution Machine Funnel Forecast Cost Entertainment 专题内容 Quality 专题内容 Alert 专题内容 Collaboration Hosting Research Extension Consulting Analysis...Faq Consulting 专题内容 Education Client Wellness Alliance 专题内容 Change User Widget Landing 专题内容 Email Section Revenue Task 专题内容 Discount Careers Review Cloud Alliance 专题内容 Community Milestone Customer Research Policy Budget 专题内容 Advertising 专题内容 Client Lead Widget Investment 专题内容 Conference Performance Fitness Budget Desktop Supplier Metric...Folder 专题内容 Security Automation Prospect Task Seminar Quality SEO Experie...Photo Partner Optimization Supplier Report Networking Story 专题内容 Planning Training Faq Wellness App Education Goal 专题内容

tech linux.do 2026-04-24 20:18:24+08:00

ok - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第61页 - 钛刻科技 | TCTI.cn

相关标签