Cal - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

tech v2ex.com 2026-04-24 22:48:43+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 22:41:38+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 21:41:54+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 20:35:40+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 20:26:48+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 20:11:08+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 20:06:39+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 19:41:32+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 18:48:29+08:00

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

最近在折腾本地大模型，发现一个核心问题：Ollama 和 LM Studio 能让模型跑起来，但参数全靠猜——上下文长度、KV cache 类型、MoE expert 放哪、ubatch 多大……用默认参数基本是在浪费显卡。于是做了个工具自动找最优配置，过程中踩了不少坑，记录一

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 18:48:29+08:00

在无人在意的角落，Ubuntu 26.04 LTS正式发布了。。。

官方新闻稿： Canonical Canonical releases Ubuntu 26.04 LTS Resolute Raccoon | Canonical The 11th long-term supported release of Ubuntu delivers de

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 18:48:09+08:00

启动claude code时报错Failed to clean tool calls

我用的ccNexus工具，就是一个本地proxy会自动负载可用的上游，然后claude code启动时就会一直切换一会，后面发消息对话是正常的，就启动这一阵 { "env": { "CLAUDE_CODE_DISABLE_NONESSENTIAL_T

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 15:13:02+08:00

deepseek v4 flash翻译挺不错的

尝试用ai优化过的calibre translator插件接入，发现翻译速度非常快，而且非常好的遵循提示词，以往会出现行数不一致的情况，deepseek v4 flash都不会有。可以猛猛瞪了！之前在网页测试感觉现在ai翻译都大差不差，不过我需要的专有名词保留以及尽量说人话的

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 13:51:14+08:00

【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达，而不是站里某些人传的昇腾

glm5有官方technical report，deepseekv4也有英文文档。连接如下 https://arxiv.org/pdf/2602.15763 huggingface.co DeepSeek_V4.pdf 68.21 KB 19 个帖子 - 12 位参与者阅读完整

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 13:46:21+08:00

DeepSeekV4来了!!

deepseek.ai DeepSeek AI 2026: R1, V3 & Local AI Hub Access DeepSeek AI for free. Independent guides for Mixture-of-Experts (MoE) archite

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 11:12:16+08:00

deepseek api文档已更新v4

deepseek api文档已更新v4 api-docs.deepseek.com Your First API Call | DeepSeek API Docs The DeepSeek API uses an API format compatible with OpenAI

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech linux.do 2026-04-24 10:49:35+08:00

[Ubuntu] 最新 kernel 6.20 内核 ubuntu26.04lts 发布了

April 23, 2026 Today Canonical announced the release of Ubuntu 26.04 LTS, codenamed “Resolute Raccoon,” available to download and install fr

相关专题

Networking Task 专题内容 Company Report Planning Guide Innovation Premium Funnel Terms...Login Online Backup Follow Saving 专题内容 Event Analytics Subject Sync Fashion 专题内容 Discovery User Review 专题内容 Local Plugin Responsive Notification 专题内容 Project Whitepaper Resource 专题内容 Sale Partner Social Segment 专题内容 Notification API 专题内容 Fitness Value Health Management Performance Unsubscribe 专题内容 Calculator Deal Message Online Device Tool Optimization Revie...Resolution Vacation Unsubscribe Analytics Label Development 专题内容 Unsubscribe Market Platform Experience Global 专题内容 Price Vacation Local 专题内容 Report Travel Restore Presentation Premium Analytics Course U...Customization Blog Event Guide Integration 视频 Version 专题内容 Responsive Excellence Layout Label Audience 专题内容 Media Dashboard 专题内容 Support Chapter Dashboard Vacation 专题内容 Traffic Advertising Sport 专题内容

tech v2ex.com 2026-04-24 06:36:44+08:00

Cal - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技 | TCTI.cn

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

[Local LLM] 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s，记录一下技术发现

在无人在意的角落，Ubuntu 26.04 LTS正式发布了。。。

启动claude code时报错Failed to clean tool calls

deepseek v4 flash翻译挺不错的

【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达，而不是站里某些人传的昇腾

DeepSeekV4来了!!

deepseek api文档已更新v4

[Ubuntu] 最新 kernel 6.20 内核 ubuntu26.04lts 发布了

最新linux7.0内核 ubuntu26.04lts发布了

Cal - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第7页 - 钛刻科技 | TCTI.cn

相关标签