发现 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第57页 - 钛刻科技

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech www.v2ex.com 2026-04-25 22:29:34+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 22:29:34+08:00

接入L站登录问题

应用接入l站登录后，我发现在授权登录后会卡很久甚至回调失败。这个和服务器有关系吗，我的是阿里云国内的机器 2 个帖子 - 2 位参与者阅读完整话题

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 22:24:57+08:00

需求发现agent

到各个平台从评论到话题找到用户需求尤其是小众领域找到需求研究对手提供产品每天进行推广和调研多agent协作评论每天给出一个最佳idea 3 个帖子 - 3 位参与者阅读完整话题

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 22:11:03+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 22:05:33+08:00

江苏IP访问机场官网跳转反诈网

年前常用的机场不挂梯子的情况下是可以正常访问官网的，年后回苏州发现流量快用完打算上官网购买个重置包，发现官网直接跳转江苏反诈网。但是询问省外的朋友能不能直连上机场，朋友都说可以直连，机场还可以用。最近拼的三个月的机场快到期了我就想看看先前的机场还能不能用，发现开着现在的梯子是可以

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 22:03:56+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 21:45:41+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 21:45:41+08:00

Windsurf的额度和cursor比怎么样，怎么自带密钥

Windsurf的额度和cursor比怎么样，怎么自带密钥qwq 不过，我在试SWE-1.6和kimi2.5比较的时候，意外发现SWE-1.6好像kimi2.5好？不过还是好奇额度和自带密钥的问题qwq 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 21:44:21+08:00

【可用】求帮测 team号池api20刀key

LD士多买了个 key，随便跑了一次后发现用不了了请佬们帮忙测试一下。目前我和我朋友好像都无法使用。佬们能用的话直接蹬点击展开接口信息（点击了解更多详细信息）第一次电脑排版，感觉有点怪我目前还是用不了，佬们直接蹬吧别浪费了 11 个帖子 - 7 位参与者阅读完整

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 21:36:20+08:00

【图一乐】技惊始皇系列，第一季！为始皇献上黑金LOGO！

最近才发现L站居然有官方T恤！又联想起往日大佬们疯狂设计LOGO的日子！顿时热血沸腾！光速化身L站首席设计师开干！（指启动Image 2）话不多说，献图！ LINUX DO 至尊黑金 LOGO （点击了解更多详细信息）【设计思路】完美音译！字体既有霸气锐利，亦不失

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 21:04:53+08:00

经过一天的尝试发现icloud邮箱创建的gpt账号没有手机号验证

这两天发现自己用的2925邮箱注册的账号全部需要手机号验证昨天买个了xyz后缀的域名配置好CF的域名邮箱也全部需要手机号验证这是我这边的情况，不知道各位佬这两种邮箱还能用吗然后今天在我们论坛的帖子里刷到了相关icloud的文章，就实验了一下，目前可以正常没有手机号验证了但

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 20:54:30+08:00

一个下午把整个 Claude 流程走了一遍

下午的时候, 突然发现之前买的账号被封禁了, 然后申请退款, 退款成功后, 又去闲鱼找代充, 充完以后, 又弹出了KYC, 又去找黑哥KYC验证, 最后终于充值成功! A 社真的太狗了, 他居然是充完钱才弹KYC验证的. 另外有没有佬友知道KYC验证以后还会不会封号? 或者有KY

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech linux.do 2026-04-25 20:46:03+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 20:44:05+08:00

我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech www.v2ex.com 2026-04-25 20:20:13+08:00

[问与答] gemini-flash-latest 和 gemini-3-flash-preview 底层相同，但定价差异大？

我在 aistudio 发现了一个很奇怪的事情，就是 gemini-flash-latest 是 gemini-3-flash-preview 的 alias ，但两者定价不同，前者输入、输出分别是 0.3 、2.5 ，后者是 0.5 、3.0 ，不知各位是否留意到这个，应该放心

相关专题

Expensive Web 专题内容 Subject 专题内容 Profit 专题内容 Campaign Extension Technology Reminder Kpi Analysis 专题内容 Investment Document Feedback Automation Support Hotel 专题内容 Profit Section User Supplier Update Blog Identity Desktop Pro...Domain Cost 专题内容 Forecast Kpi System Photo Hotel Widget Optimization 专题内容 Project Internet Section Ranking Dashboard 专题内容 Community Vendor Planning Reminder 专题内容 Desktop Strategy Internet Button Goal Research Saving 专题内容 Calendar User Template Analytics 专题内容 Label Engagement Discount 专题内容 Customization Saving Learning Task Communication Growth Train...Hosting Careers Partner Budget Chapter Products Widget Task 专题内容 Resource Help Vendor Revenue Calendar Experience Reminder 专题内容 Discovery Resolution 影视专题内容 Conversion Comment Target Feedback Guide 专题内容 Integration 专题内容 Document Browser Template Contact 专题内容

tech v2ex.com 2026-04-25 20:15:01+08:00

发现 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第57页 - 钛刻科技 | TCTI.cn

相关标签