Qwen3.6-27B和Qwen3.6-35B-A3B的nvfp4量化在dgxspark下面的速度表现
模型来源 RedHatAI/Qwen3.6-35B-A3B-NVFP4 · Hugging Face sakamakismile/Qwen3.6-27B-NVFP4 · Hugging Face Qwen3.6-35B-A3B速度 单用户串行测试 : num_prompts=20
量化 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第2页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 69 篇相关文章 · 第 2 / 4 页
模型来源 RedHatAI/Qwen3.6-35B-A3B-NVFP4 · Hugging Face sakamakismile/Qwen3.6-27B-NVFP4 · Hugging Face Qwen3.6-35B-A3B速度 单用户串行测试 : num_prompts=20
问一句答一句,不动一下工具。我抓包了一下发现响应体根本都没tooluse 大概率是超低量化直接关闭工具。 ❯ 我是一名java开发者。现在需要我接管一个pass平台,这是个模板项目,可以上传后作为微服务部署到云。帮我分析这是基于什么技术,如何启动 ● 我来分析这个项目的技术栈和结
当然Deepseek更了解大A的尿性,加上搜索功能,风险意识真值得表扬。水平与Copilot 的企业版差不多,不过后者节点要求多,速度也慢。 1 个帖子 - 1 位参与者 阅读完整话题
如题,以模型minimax m2.5(原本权重,先不考虑量化)为例,如何知道这个模型具体需要多大的显存才可以部署? 另外,NPU还是GPU应该没多大区别吧,主要是看显存多少。 请佬们指条明路 12 个帖子 - 9 位参与者 阅读完整话题
app.mokahr.com DeepSeek招聘 2026年幻方量化社会招聘正在进行,点击申请职位 为不存在的东西安全吗 3 个帖子 - 3 位参与者 阅读完整话题
一、GSConv论文理论 论文地址: [Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles] 1.理论思想 本文引入了一种新方法 GSCon
一直想做量化,自己花了一个月调研开发,然后完成了一个趋势跟踪的程序,使用 python 的 ccxt 库。 4 小时指标判断趋势,1 小时指标进场,不停的调整参数。 回测历史几年都很好,跑了 2 周,被黄毛嘴炮搞怕了,一直震荡止损。 一点正向反馈都没有,而且维护太花时间了,各种异
我这里设计了一个双输入双输出的分割模型(一些特殊识别需求),要部署在 RKNN 平台上。这个模型是基于 mobilenetv3 做为backbone 开发的。 这没什么问题,问题出现在量化上。 因为训练很慢,为了快速验证,我拿第一个epoch 来走流程,去验证模型是否可以部署在
一直想做量化,自己花了一个月调研开发,然后完成了一个趋势跟踪的程序,使用 python 的 ccxt 库。 4 小时指标判断趋势,1 小时指标进场,不停的调整参数。 回测历史几年都很好,跑了 2 周,被黄毛嘴炮搞怕了,一直震荡止损。 一点正向反馈都没有,而且维护太花时间了,各种异
一直想做量化,自己花了一个月调研开发,然后完成了一个趋势跟踪的程序,使用 python 的 ccxt 库。 4 小时指标判断趋势,1 小时指标进场,不停的调整参数。 回测历史几年都很好,跑了 2 周,被黄毛嘴炮搞怕了,一直震荡止损。 一点正向反馈都没有,而且维护太花时间了,各种异
一直想做量化,自己花了一个月调研开发,然后完成了一个趋势跟踪的程序,使用 python 的 ccxt 库。 4 小时指标判断趋势,1 小时指标进场,不停的调整参数。 回测历史几年都很好,跑了 2 周,被黄毛嘴炮搞怕了,一直震荡止损。 一点正向反馈都没有,而且维护太花时间了,各种异
你们在哪些平台玩量化操作a股的呢?大佬们 1 个帖子 - 1 位参与者 阅读完整话题
项目地址 GitHub - zwmmm/CCManager · GitHub 之前在用 CC Switch,功能是很全,但越用越觉得哪里不对劲。 每个供应商都有单独的配置窗口,配置合并逻辑搞得很复杂,经常莫名其妙就把我的配置给覆盖了。而且这软件越更新越重,塞进去一堆我用不上的功能
我是50系显卡,听说了nvfp4格式的量化模型能最大程度上利用显卡的算力,想尝试一下,但是在魔塔跟huggingface都没有找到现成的模型,想自己量化又不知道该怎么做,问大模型也是各说各的方式 1 个帖子 - 1 位参与者 阅读完整话题
llama.cpp 支持的APEX量化效果挺好的, https://huggingface.co/mudler/Qwen3.6-35B-A3B-APEX-GGUF 根据该量化库的作者的表述 , 消费级显卡可用的 Qwen3.6-35B-A3B-APEX-I-Compact.ggu
这是一个悲伤的实盘复盘,也是一篇价值可能远超本金的“避坑指南”。 交学费了 背景:2005 年就开了股票账户,但一直没有买卖过股票,觉得看不懂。直到 2025 年初,才开始学习研究量化,并用 2.5 万起步人工或量化实盘。 比较典型新手行为:2025 年 6 月 24 日 2.5
IT之家 4 月 21 日消息,英伟达昨日(4 月 20 日)发布博文,针对当前边缘设备内存受限情况,通过架构优化 NVIDIA Jetson 平台,最高可释放约 12 GB 内存,帮助开发者优化 AI 模型部署。 在基础软件层,英伟达表示禁用图形桌面界面,最高可以释放 865
这是一个悲伤的实盘复盘,也是一篇价值可能远超本金的“避坑指南”。 交学费了 背景:2005 年就开了股票账户,但一直没有买卖过股票,觉得看不懂。直到 2025 年初,才开始学习研究量化,并用 2.5 万起步人工或量化实盘。 比较典型新手行为:2025 年 6 月 24 日 2.5
这是一个悲伤的实盘复盘,也是一篇价值可能远超本金的“避坑指南”。 交学费了 背景:2005 年就开了股票账户,但一直没有买卖过股票,觉得看不懂。直到 2025 年初,才开始学习研究量化,并用 2.5 万起步人工或量化实盘。 比较典型新手行为:2025 年 6 月 24 日 2.5
这是一个悲伤的实盘复盘,也是一篇价值可能远超本金的“避坑指南”。 交学费了 背景:2005 年就开了股票账户,但一直没有买卖过股票,觉得看不懂。直到 2025 年初,才开始学习研究量化,并用 2.5 万起步人工或量化实盘。 比较典型新手行为:2025 年 6 月 24 日 2.5