通义千问 Qwen3.6-27B 宣布开源:270 亿参数稠密模型,编程能力超越 15 倍规模 MoE 模型
IT之家 4 月 22 日消息,阿里云通义千问团队今日宣布,开源模型家族迎来新成员 ——Qwen3.6-27B。这是一款拥有 270 亿参数的稠密多模态模型,也是社区呼声最高的模型规格。 此前,通义千问已陆续发布了 Qwen3.6-Plus 和 Qwen3.6-35B-A3B,而
模型 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第100页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 2789 篇相关文章 · 第 100 / 140 页
IT之家 4 月 22 日消息,阿里云通义千问团队今日宣布,开源模型家族迎来新成员 ——Qwen3.6-27B。这是一款拥有 270 亿参数的稠密多模态模型,也是社区呼声最高的模型规格。 此前,通义千问已陆续发布了 Qwen3.6-Plus 和 Qwen3.6-35B-A3B,而
如题,看到 cc switch 能使用 GPT-5.4 ,但会提示有封号风险,不太敢这么做。想问下有其他方式吗?先谢谢了。
可以打开你的 codex cli 或者 codex app , 在模型选择一栏可能会出现 5.5
我的网页对话是一直在qwen的官网使用各个模型的,之前qwen3 3.5都一直这么用过来了,包括前段时间qwen-3.6 plus都用的好好的。今天想到qwen3.6-max早就发布了,就切换到max问了一个问题。结果它的回答里还参杂着俄文,我是真的第一次见,这是用什么语料训练,
看到各位佬发的image2生成的图片都太强了,求助可以在cherry studio怎么调用这个模型,必须要在gpt官方使用吗? 2 个帖子 - 2 位参与者 阅读完整话题
国内大模型,写代码有推荐的吗,glm5用着用着就超时了,不知道哪些用着比较舒服 3 个帖子 - 3 位参与者 阅读完整话题
grok是主流模型里面对nsfw最宽容的,查一些瑟瑟还是好用的 现在所有普通账号都显示这个,除非你开大会员(并发多了,偶尔能回答一点) 马斯克将算力都租给cursor,本家都扛不住了,reddit上都在猜测这么长时间都没回复,没准要砍免费额度,或者干脆放弃免费用户 2 个帖子 -
如题,看到 cc switch 能使用 GPT-5.4 ,但会提示有封号风险,不太敢这么做。想问下有其他方式吗?先谢谢了。
创建API秘钥时找不到支持哪些模型,然后也没有模型广场,这个模型名字从哪里可以看到 4 个帖子 - 4 位参与者 阅读完整话题
奇怪的事情: 从 CLI Proxy API 管理中心的 配额管理 里看到 周额度 还剩 100% ,如下图: 但从 New API 里测试却提示需冷却: bad response status code 429, message: All credentials for mod
标题是开玩笑。 诶嘿。 之前那个模型有点指哪打哪的感觉。 因为是改自己的作品集和简历所以就不发了。 刚才崩溃之后用Kimi 2.6都没有这种感觉。 新模型确实有不会的,但是说一次就好,不需要说第二次。 这种能力……非常重要。 1 个帖子 - 1 位参与者 阅读完整话题
问GPT数学上的问题,也在生成图像??? 1 个帖子 - 1 位参与者 阅读完整话题
OpenAI 近一周来陆续向美国联邦机构、州政府以及“五眼联盟”情报共享伙伴介绍其最新网络安全产品 GPT-5.4-Cyber 的能力,希望推动相关政府部门加入其网络安全专用访问计划。该公司在华盛顿举行闭门活动,邀请大约 50 名来自联邦政府各部门、负责日常网络安全工作的专业人员
有佬友知道CPA弄出来的image2,三个模型怎么做newapi里给合成一个gpt-image-2吗? CPA弄出来是下面三个模型: gpt-draw-1024x1536 gpt-draw-1024x1024 gpt-draw-1536x1024 应该用什么方法在newapi里合
用的时候发现回答风格变了,一问,果然是新模型。
尝试了下 gpt 今天新发布的生图模型,让他根据我的 产品官网 ,生成一张宣传图,把主要功能以及亮点都告知给用户。 最终生成的图,还挺好看。
用的时候发现回答风格变了,一问,果然是新模型。
有没有深度使用 kimi2.6 和 glm5.1 的?哪个套餐能平替 gpt5.4(free),deepseek 一直没出留个坑作为推理模型。另外我对前端要求低…主要要会说人话、会主动调各种 skill、cli 工具、coding 后 fix bug 能接近 gpt 就行了。 8
特斯拉中国车机语音大模型服务已于 4 月 20 日完成备案,车机语音服务将接入豆包大模型。此前特斯拉中国官网披露,Model Y L 将搭载豆包大模型和 DeepSeek 模型,均通过火山引擎接入。 其中,豆包大模型主要负责语音命令,包括导航设定、媒体播放控制、空调调节和车主手册
我这里设计了一个双输入双输出的分割模型(一些特殊识别需求),要部署在 RKNN 平台上。这个模型是基于 mobilenetv3 做为backbone 开发的。 这没什么问题,问题出现在量化上。 因为训练很慢,为了快速验证,我拿第一个epoch 来走流程,去验证模型是否可以部署在