IT之家 6 月 2 日消息,阿里千问大模型今天(6 月 2 日)发布博文,宣布推出 Qwen3.7-Plus 模型,定位为多模态交互混合智能体。
Qwen3.7-Plus 是 Qwen3.7 的多模态升级版,核心定位是视觉与语言统一的智能体基座。
它保留文本、编码、工具使用和生产力工作流能力,同时强化视觉理解、视觉推理和跨模态任务处理。

模型已通过阿里云百炼提供服务,也可在 Qwen Studio 体验。它支持图像、视频、屏幕、网页和文本输入,面向复杂软件与办公流程,可在 GUI(图形用户界面)、CLI(命令行界面)和工具环境中完成任务。

在模型表现上,Qwen3.7-Plus 凭 Vision Arena 成绩帮助阿里进入全球前 5、中国第 1。

纯文本测试中,它接近 Max 级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持强表现。

多模态测试显示,该模型强化了视觉推理、工具调用和任务执行链路。它在 BabyVision、MathVision、ScreenSpot Pro、OSWorld-Verified、AndroidWorld 等评测中提升明显。

IT之家附上参考地址