谁才是8卡H200服务器的终极归宿,GLM-5.1-FP8 vs Kimi-2.6 vs ... ?
目前有一台闲置 H200(显存141Gb)*8 的服务器,想部署本地模型体验一波,目前考虑的有2个,GLM-5.1-FP8和Kimi-2.6,有佬深度使用过哪个更强一些吗,或者还有其他模型推荐吗 模型 架构 专家数 参数量和激活 模型权重 HuggingFace 链接 Kimi
... - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 249 篇相关文章 · 第 5 / 13 页
目前有一台闲置 H200(显存141Gb)*8 的服务器,想部署本地模型体验一波,目前考虑的有2个,GLM-5.1-FP8和Kimi-2.6,有佬深度使用过哪个更强一些吗,或者还有其他模型推荐吗 模型 架构 专家数 参数量和激活 模型权重 HuggingFace 链接 Kimi
哪个大佬指导一下,,怎么改上面的节点...能点的设置,我都看了一遍,真的没找到可以自定义的地方.
原来小米的Credits并不是Tokens 一次对话瞬间消耗了我82w,我这3文件加起来还没几千个字符 不知道小米的这个计算方式是怎么样的,最小单元就是82w吗? 有没有大佬能给解答一下 环境:桌面版Claude Code MiMo V2.5Pro 补充:我从开始用到现在占用的
自从DS 4 PRO 开了 2.5折. 这几天用爽了… 感觉真的非常厉害. 可一想到恢复原价每天就得小一百就肉疼… 18 个帖子 - 12 位参与者 阅读完整话题
大家好,我五月二号就要当伴郎了,新郎是本家的一个叔叔(大我一岁)。 我是第一次当伴郎,请问大家有什么当伴郎的经验和注意事项吗?诚心求教
大家好,我五月二号就要当伴郎了,新郎是本家的一个叔叔(大我一岁)。 我是第一次当伴郎,请问大家有什么当伴郎的经验和注意事项吗?诚心求教
大家好,我五月二号就要当伴郎了,新郎是本家的一个叔叔(大我一岁)。 我是第一次当伴郎,请问大家有什么当伴郎的经验和注意事项吗?诚心求教
想看个短剧,国外没有这资源,要不就糊的一塌糊涂的 看到站内有佬友分享过这个资源,但是只有百度网盘的,在国外没有百度网盘阿… 有没有佬友能帮帮忙下载然后上传到Mega或者是蓝奏里面?? 可以有偿lDC,不过我不知道要多少,来的佬友自己开吧。 大约10个G左右…今天中午前能弄好就好了
“IT早报”时间,大家好,现在是 2026 年 4 月 29 日星期三,今天的重要科技资讯有: 1、央视解读“中方禁止 Manus 并购案”:禁的是企业“洗澡式出海” 2025 年 12 月,Meta 高调宣布以约 20 亿美元收购 Manus。作为一家依靠中国工程师和基础设施环
01:27 还在和 Opus 讨论怎么在那个逼1200字里塞下我的主要履历 01:28 点了提交------ 您猜怎么着,我都不知道有没有到 01:29,来邮件了! 所以,根本没必要浪费时间玩什么真情实感,直接提示词注入吧 4 个帖子 - 3 位参与者 阅读完整话题
没想到今天warp开源了 github.com GitHub - warpdotdev/warp: Warp is an agentic development environment, born... Warp is an agentic development environ
咨询各位佬一个事情…用Antigravity Tools给我号搞风控后,我尝试申请解封,可是过了72h完全没收到消息.这号是彻底寄了吗? 1 个帖子 - 1 位参与者 阅读完整话题
image2+figma有没有搞头?貌似不需要付费订阅的会员… 3 个帖子 - 2 位参与者 阅读完整话题
“IT早报”时间,大家好,现在是 2026 年 4 月 28 日星期二,今天的重要科技资讯有: 1、国家发改委:依法依规对外资收购 Manus 项目作出禁止投资决定 国家发改委外商投资安全审查办公室依法对外资收购 Manus 项目作出禁止投资决定,并要求撤销相关交易。这体现了国家
最近在尝试本地部署 Qwen3.6-27B 和 Gemma4-31B,发现因为是 Dense 模型,两者的生成速度都挺慢(相比 200多 B 的 MoE 模型而言,速率还低了一半,只有约 25-30 token/s)。但是我发现 Qwen3.6 支持 Multi-Token Pr
我没有升级,不过是19年的老号,之前日本的老号升级失败灰飞烟灭了, 到处看都说甲骨文限速了什么的,刚好有空了,跑一下脚本测试并没有啊… 11 个帖子 - 7 位参与者 阅读完整话题
原来一个月 30 美元, 现在要 60 美元了.
github.com GitHub - mksglu/context-mode: Context window optimization for AI coding agents.... Context window optimization for AI coding agen
我前几天使用的都是没有问题的,现在都不报错了,直接没有回应了。 2 个帖子 - 2 位参与者 阅读完整话题
使用CPA(v6.9.36)代理的free账号一直出现Reconnecting…然后就挂掉了 stream disconnected before completion: Transport error: network error: error decoding respons