vLLM - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技

[Local LLM] LiteChat 轻量级本地大模型聊天 WebUI，支持 vLLM

https://github.com/zsj1029/LiteChat 企业内部场景适用，从 llama-cpp 的 webui 扒出来的，本地改造了下支持 vllm 全程 Qwen3.6 27B (vLLM), Claude Vscode 改造

相关专题

tech v2ex.com 2026-05-05 14:30:33+08:00

[Local LLM] LiteChat 轻量级本地大模型聊天 WebUI，支持 vLLM

https://github.com/zsj1029/LiteChat 企业内部场景适用，从 llama-cpp 的 webui 扒出来的，本地改造了下支持 vllm 全程 Qwen3.6 27B (vLLM), Claude Vscode 改造

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech v2ex.com 2026-05-05 13:26:23+08:00

[Local LLM] LiteChat 轻量级本地大模型聊天 WebUI，支持 vLLM

https://github.com/zsj1029/LiteChat 企业内部场景适用，从 llama-cpp 的 webui 扒出来的，本地改造了下支持 vllm 全程 Qwen3.6 27B (vLLM), Claude Vscode 改造

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech v2ex.com 2026-05-05 13:26:23+08:00

[Qwen3.6]27B-FP8 SGLang本地部署-venv dev经验分享。

上集回顾 [Qwen3.6]27B-FP8 VLLM本地部署主观个人测评环境： WLS2 Ubuntu22.04 硬件： 4090 48G SGLang太佛系了，快一个月了还不更新正式版，需要好好挖掘pr。目前已经找到4090 48G本地部署的版本。我测试了两个模型。以及DF

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech linux.do 2026-05-04 10:21:26+08:00

xllm 真的比 vllm+plugin 性能好么？

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech www.v2ex.com 2026-04-27 13:46:35+08:00

昇腾910B本地部署DeepSeek-V4-Flash(w8a8量化版)测试

老登们下班了，现在可以霍霍服务器了 vllm-ascend部署文档： DeepSeek-V4 — vllm-ascend 模型： DeepSeek-V4-Flash-w8a8-mtp · 模型库启动成功：先问一下洗车问题：逻辑OK 跑一下文档中的数据集(GSM8K，数学推理

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech linux.do 2026-04-24 18:41:13+08:00

到底怎么才能降低Qwen3.5-35B-A3B的think啊

大佬们最近用最新的gpustack2.1.2版本搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。官方文档说可以靠thinking_budget参数来调节思考的长度，但是根本不好使啊.. system角色写提示词要求它精简思考过程也不行。。。。没招了.. 1

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech linux.do 2026-04-24 12:47:47+08:00

[Qwen3.6]27B-FP8 VLLM本地部署主观个人测评

硬件配置组件规格 CPU Intel i5-13600K GPU RTX 4090 48G + RTX 4070Ti 12G 内存 DDR4-3600 128G (4x32G) 主板华硕 Z690-P D4 系统 Windows 11 LTSC WSL Ubuntu 22.

相关专题

Tool Fashion Cheap Email 专题内容 Conversion Template Profit Meeting Deadline 专题内容 Event 专题内容 Terms Whitepaper Creative Community Alert 专题内容 Update Feedback Hosting Roi User Mobile Button Template 专题内容 Strategy Accessibility Download Status Extension Cost Subject...Retention Prospect System Alliance Budget Vendor Economy 专题内容 Client Tactic Calculator Case Fashion Layout Discovery 专题内容 Software Hosting Alert Backup Management Whitepaper Photo 专题内容 Collaboration Update Alert Campaign Optimization Engagement 专题内容 Luxury 游戏 Report Sync 专题内容 Products Upload SEO Sync 专题内容 Lesson Wellness 财经 Platform Company Document Sync 专题内容 Planning Responsive Training Budget Premium Roi 专题内容 Growth Training 财经 Subject Innovation Unsubscribe 专题内容 Quality Interface Campaign Keyword Progress Theme 专题内容 Revenue 专题内容 Subject Discount Hotel Analysis Resource Settings 专题内容 Discovery Presentation Revenue Notification Business Software...Tool Innovation Download 专题内容

tech linux.do 2026-04-24 00:28:36+08:00

vLLM - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

相关标签