qwen3.6-35b-a3b-apex 天气卡片测试
是在hermes中生成的,提示词如下: 你是 Apple Inc 的顶级 UI 设计师,以 iOS 18 的设计风格(毛玻璃效果、高斯模糊、动态渐变、细腻阴影)创建一个单个HTML文件(包含完整CSS和JavaScript)。实现横板天气页面,包含4个并排的动画天气卡片: 晴天(
A3 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第2页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 68 篇相关文章 · 第 2 / 4 页
是在hermes中生成的,提示词如下: 你是 Apple Inc 的顶级 UI 设计师,以 iOS 18 的设计风格(毛玻璃效果、高斯模糊、动态渐变、细腻阴影)创建一个单个HTML文件(包含完整CSS和JavaScript)。实现横板天气页面,包含4个并排的动画天气卡片: 晴天(
感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点: 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。 经过豆包和模型自
感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点: 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。 经过豆包和模型自
感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点: 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。 经过豆包和模型自
感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点: 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。 经过豆包和模型自
感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点: 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。 经过豆包和模型自
我是windows上llama.cpp部署的,先看效果图。 这里面,我用的模型是 unsloth 量化的 Qwen3.6-35B-A3B-UD-IQ1_M 模型。 得益于其超强的量化,整个模型可以完美装在 2080ti 11g 显存里面,用 q4 量化上下文可以跑到128k 的上
pk-19c1b3a3-9431-4f1a-8bf1-5f556b7ae2be 买了没咋用,五月二号到期,各位佬友拿去登吧,刚升级的萌新没啥分享的,望各位佬不要嫌弃 3 个帖子 - 2 位参与者 阅读完整话题
匈牙利航空第二架空客A330货机近日已飞抵布达佩斯李斯特·费伦茨国际机场,标志着这家航空公司在中匈航空货运布局上再进一步。根据报道,这架拥有匈牙利注册编号HA-ZTO的飞机于周五晚间抵达布达佩斯,由公司首席飞行员László Eschenbach机长和副驾驶Gergely Men
模型来源 RedHatAI/Qwen3.6-35B-A3B-NVFP4 · Hugging Face sakamakismile/Qwen3.6-27B-NVFP4 · Hugging Face Qwen3.6-35B-A3B速度 单用户串行测试 : num_prompts=20
去年DeepSeek R1出的时候,还出了好几个蒸馏小模型,基座是qwen2.5和llama3,现在v4也有思维链,大概不会有R2了,正好前端时间qwen3.5和qwen3.6出了,不知道会不会继续搞蒸馏小模型,当然最好是直接拿v4 pro做个小模型 1 个帖子 - 1 位参与者
哇牛的,上次看见还是qwen3的80b-A3B如此小规模的激活参数呢 2 个帖子 - 2 位参与者 阅读完整话题
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。 官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊.. system角色写提示词要求它精简思考过程也不行。。。。 没招了.. 1
https://sub1.smallstrawberry.com/api/v1/client/subscribe?token=02150886ea5061434ca377c3edd54cfe 1 个帖子 - 1 位参与者 阅读完整话题
token.zhilu.online Coder Token - AI API Gateway sk-0b6812a03376e20a711b8bb701b83b68a334e5669ee3b2467acd0ab8eb0e4248 350刀,0.7倍消耗,差不多就是500刀额度咯
先说配置: CPU: E5-2680 v4 * 2 内存: 220G GPU: 3090 24G *2 系统:Ubuntu20 工具: LM Studio 0.4.11 Qwen3.6-27B Qwen3.6-35B-A3B 默认专家数量为8,这里佬友自行设置为了9, 问题是:“
对比deepseek的价格 3 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 22 日消息,达尔优 (DAREU) 今日正式推出了 A3 MAX 头戴式电竞无线耳机。该型号 搭载 53mm 驱动单元 ,支持 2.4GHz 与蓝牙两种无线连接方式, 音频延迟低至 10ms ,磁吸充电底座兼具 2.4GHz 信号接收器和电量显示功能。 A3
IT之家 4 月 21 日消息,据外媒 Notebook Check 报道,影石 Insta360 除了将推出 Insta360 Luna Ultra 双摄云台相机外,还将推出一款 Insta360 Luna Pro 单摄产品。 此前消息显示,系列云台相机预计将于 6 月发布,其
llama.cpp 支持的APEX量化效果挺好的, https://huggingface.co/mudler/Qwen3.6-35B-A3B-APEX-GGUF 根据该量化库的作者的表述 , 消费级显卡可用的 Qwen3.6-35B-A3B-APEX-I-Compact.ggu