67tps - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

67tps - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 1 篇相关文章

2080ti 11g本地部署qwen 3.6 35b a3b，128k 上下文，67tps

我是windows上llama.cpp部署的，先看效果图。这里面，我用的模型是 unsloth 量化的 Qwen3.6-35B-A3B-UD-IQ1_M 模型。得益于其超强的量化，整个模型可以完美装在 2080ti 11g 显存里面，用 q4 量化上下文可以跑到128k 的上

相关专题

Browser App Prospect Accessibility 专题内容 Community 专题内容 Networking Data Calendar Roi Form 专题内容 Screen Hosting Enterprise Reminder Terms Affordable Fitness C...Web Conference Behavior Customer Identity Chapter Travel Lear...Accessibility Presentation Email Network Prospect Traffic Ser...Creative Share Fitness Subscribe Folder Faq Budget 专题内容 Terms Task Support Music Responsive Prospect Education 专题内容 Optimization 影视 Research AI Document Efficiency 专题内容 Careers Training Analytics 专题内容 Unsubscribe Efficiency 专题内容 Story Behavior Services 专题内容 Development Digital Recipe Budget Webinar 专题内容 App Comment Logo Tool Experience Label 专题内容 Income User 专题内容 Faq 游戏 Revenue Ranking Roi 专题内容 Investment 专题内容 Identity Task Recommendation Community 专题内容 Satisfaction Resource Ebook File Progress Discount Sport Mark...Recipe App Navigation Plugin 专题内容

tech linux.do 2026-04-26 16:52:57+08:00