Prompt复述?
佬友们有个困惑求解,自部署Qwen3.5 27B,做一套偏知识类的Agent 现在的情况就是如果走Native Reasoning输出,会暴露系统约束、工具Key啥的,模型跑去复述系统提示词,如果不开而是通过提示词约束模型输出类思维链,又感觉不是很稳定。 就是感觉模型的思维过程还
Qwen - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第10页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 197 篇相关文章 · 第 10 / 10 页
佬友们有个困惑求解,自部署Qwen3.5 27B,做一套偏知识类的Agent 现在的情况就是如果走Native Reasoning输出,会暴露系统约束、工具Key啥的,模型跑去复述系统提示词,如果不开而是通过提示词约束模型输出类思维链,又感觉不是很稳定。 就是感觉模型的思维过程还
如题, 我是wsl+ollama, 试了一个qwen3.5 2b 4b 9b, 都贼拉难用, 我就问他 1+1=? , 一直搁那吐字, 思考, 我记得以前2023年的ChatGLM没这么难用的啊, glm问他是谁他都正常吐字就完事了, qwen一直搁那思考自己是阿里巴巴开发的,
部署了一个Qwen3.6-35B-A3B 怎么感觉有点呆啊 是不是真不行啊 2 个帖子 - 1 位参与者 阅读完整话题
求一个有text-embedding-3-small或者Qwen3-Embedding-8B的公益站,感谢佬们 3 个帖子 - 2 位参与者 阅读完整话题
两张3090 48G显存 私有化部署35B大模型, 生成速度142.65tokens/s 上下文长度262144 真香 8 个帖子 - 5 位参与者 阅读完整话题
最近尝试了用gemini(nanobanana) gpt 和 qwen用来生成PPT,发现效果远不如小红书等平台上调出来的效果,生成中文经常鬼画符,图标也容易和解释文字关系不大。不知这种问题一般如何解决.本人目前用的还是官网入口的免费模型 2 个帖子 - 2 位参与者 阅读完整话
总结 这么小的模型有这个能力,还是让我感觉挺开心的,阿里牛逼 体验挺好的,希望再接再厉 部署情况 部署版本: unsloth UD_Q6K 部署硬件: 4080 Super 32G + 5060Ti 16G Token速度: 90token/s 上下文 256K拉满 只多5G显存
笔记本配置 32GB 内存加 8GB 5060,就是生成速度会有点慢(24token/s) 但这个天气卡片真不想像是本地模型能跑出来的。 如果想试试接入 coding agent,推荐 PI,对模型负担很轻,作为一个小电脑助手又快又好 同类推荐: 5060 笔记本成功部署 Gem
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
你是一位就职于苹果公司的顶级前端工程师。请创建一个包含CSS和JavaScript的HTML文件,用于生成动画天气卡片。卡片需要以不同动画效果直观展示以下天气状况: 风力(如:飘动的云朵、摇曳的树木或风线) 降雨(如:下落的雨滴、形成的水洼) 晴天(如:闪耀的光线、明亮的背景)
codex都封了,claude也没有了,转向qwen, 如何抢到百炼coding plan呢? 大家有经验吗 4 个帖子 - 3 位参与者 阅读完整话题
IT之家 4 月 16 日消息,继 Qwen3.6-Plus 发布之后,阿里千问大模型今日宣布开源 Qwen3.6-35B-A3B —— 一个稀疏但能力出色的混合专家(MoE)模型,总参数量为 350 亿,激活参数仅 30 亿。 官方称,Qwen3.6-35B-A3B 不但轻量高
IT之家 4 月 16 日消息,科技媒体 NeoWin 昨日(4 月 15 日)发布博文,基于 Microsoft 365 路线图, 微软计划支持 IT 管理员配置 Edge 浏览器,限制员工使用 Qwen、Gemini、Grok 等 AI 工具,并引导员工使用合规的 Copil
IT之家 4 月 12 日消息,阿里云开源的桌面 Agent 工具 CoPaw 今日发布了最新的 1.1.0 版本并宣布更名为 QwenPaw。 官方表示,此次品牌重塑标志着项目进入开源开发的新阶段,新名称更好地反映了团队正在构建的开放生态系统以及持续追求的更广阔方向。 名称中的
36氪获悉,4月24日,DeepSeek V4发布。“电商龙虾”的Accio Work已经接入该模型,成为首批接入DeepSeek V4的Agent工作台之一。此外,Qwen 3.6等国产模型也均已接入Accio Work。据了解,Accio Work是阿里国际面向全球推出的企业
36氪获悉,阿里发布Qwen3.6-Max-Preview。据了解,该模型是新一代千问旗舰模型的早期预览版,拥有更强的世界知识和指令遵循能力,以及在多项基准上显著提升的智能体编程表现。
36氪获悉,4月16日晚,阿里千问开源其中等尺寸模型Qwen3.6-35B-A3B,仅激活3B即超越谷歌最新发布的Gemma4-31B模型。